华西二院:大语言模型在医院场景中的落地路径与应用实践

发布时间:2025-07-22
浏览次数:

  DeepSeek V3/R1发布后,在多项基准测试中表现优于GPT-4等主流模型,迅速赢得了业界的广泛赞誉,其开源模式也为大模型的私有化部署带来可行性。随后,国内多家医院开始在患者就医服务、智能导诊、辅助诊断及电子病历书写等场景尝试使用DeepSeek。当下,如何激发出大模型的能力并深度结合医疗业务系统,成为医疗信息化领域一个新的技术研究方向,四川大学华西第二医院(简称“华西二院”)也在这方面做出了一些探索与实践。

大语言模型落地技术路径

大语言模型是能力内核,提供认知能力,擅长处理输入输出映射;智能体(Agent)是应用载体,通过整合模型能力与工具调用、记忆、规划模块成为动态系统。要落地到医院的应用场景,通常涉及两个关键技术环节,模型训练和智能体开发。模型训练强化医疗专业知识,智能体开发则是将模型能力与业务系统深度融合,二者结合实现“模型能力→业务落地”的闭环。

22.jpg

图1 大语言模型应用落地技术路径示意

1.模型训练

(1)预训练(Pre-Training)

预训练需要海量数据和大规模分布式GPU算力,成本高难度大。以DeepSeek为代表的开源大模型已公开权重,在医疗行业中已无需从零开始预训练模型,只需根据场景选择合适的模型,或在选定模型基础上进行能力增强即可。

(2)监督微调SFT(Supervised Fine-Tuning)

预训练模型已具备通用特征,可部分适应医疗领域任务,监督微调是通过专业领域的标注数据集对预训练模型进行全参数或部分参数更新,使模型更好地遵循指令。华西二院利用真实院内数据(如电子病历、检验检查报告、医嘱等),经过脱敏、清洗、筛选等处理后,通过人工标注和模型合成等方式构建高质量监督微调数据集,对预训练模型进行专业能力增强。

(3)强化学习RLHF(Reinforcement Learning with Human Feedback)

RLHF是一种融合强化学习与人类反馈的技术,通过人类反馈数据指导模型优化,使其生成更符合预期的响应。在华西二院,将医生在使用辅助诊断时对AI建议的采纳情况作为偏好数据:医生采纳的建议作为正样本,未采纳的作为负样本,用于大模型的进一步微调。

2.智能体(Agent)开发

智能体开发,即通过提示词工程、工作流编排和外部医学知识库构建等技术手段,引导大模型实现精准推理并深度结合业务系统。

(1)提示词工程(Prompt Engineering)

提示工程是通过精心设计输入指令(Prompt)来引导大模型生成更准确的输出,类似于"教导AI如何回答问题"。精心设计的提示词能够有效解决模型输出偏离预期、逻辑性不足及专业领域表现欠佳等问题。常见的方法包括明确任务要求、进行角色设定、引入思维链、少样本提示等。

(2)工作流程编排(Work Flow)

在开发智能体时,通常将复杂任务分解为多个子步骤,每个步骤都有明确目标,比如意图识别、知识库查询、逻辑判断或通过外部API获取信息等。比如在处理导诊请求时,首先通过大模型分析自然语言,识别患者症状并分析可能诊断,再通过函数调用集成平台API获取科室信息,进一步查询医生排班和号源信息,最终由大模型返回可挂号医生的链接。

(3)RAG检索增强生成(Retrieval-Augmented Generation)

由于大模型缺乏最新的医疗专业知识和医院特有的管理流程等信息,RAG通过对这类文档进行数据处理和索引,将其存储在向量数据库中。当处理入院流程、退费政策、医保报销等客服咨询时,即可通过RAG技术检索知识库,将结果作为上下文输入模型,最终生成准确回复。

(4)函数调用(Function Call)

对于业务知识,则通过自然语言描述的方式定义函数(Function),包括函数名称、功能描述、参数名称及说明,并传递给大语言模型(LLM)。如患者提出"挂儿科张医生明天的号"时,系统首先调用"获取当前日期"函数并计算次日日期,再调用"查询排班及号源(医生姓名、日期)"API,最后将API返回结果作为上下文输入模型生成最终结果。

(5)多智能体协同(Multi-Agent System)

面对更复杂的业务场景时,可设计由多个智能体构成的系统。这些智能体类似医院多学科会诊(MDT)模式工作。EGO智能体负责任务状态管理和工作智能体调度(如会诊主持人),工作智能体各自负责特定任务(如专科医生、药事专家等提供专业决策),技能智能体执行单一任务(如查询临床指南、解读报告、检索药品说明书等),通过这些智能体按需协作解决复杂问题。

华西妇幼数字医生设计与开发实践

医院AI应用需要基于具体场景进行分析,选择最优技术路线和最佳工具以实现预期目标。以华西二院数字医生项目开发为例,从需求分析到应用上线共定义5个关键环节,并贯穿持续迭代理念。

23.jpg

图2 AI应用开发关键路径

1.需求分析

年初,华西二院在调研时发现,当前门诊流程中,医生问诊时间有限,了解患者既往病史和主诉时,常出现信息获取不全或遗漏;部分需检查确诊的患者,往往需再次挂号和就诊;同时医生需耗费大量时间来书写电子病历。

华西二院提出以下需求:患者在挂号后,由AI通过自然语言会话方式模拟医生诊断逻辑收集患者信息进行预问诊,随后生成预判并推送至接诊医生。医生审核对话记录后,如判断需提前检查可向患者推送自主开单检查建议。就诊当日,医生接诊后可查阅数字医生预问诊记录和检查报告,与HIS集成的数字医生系统通过诊间麦克风采集医患对话辅助医生完成电子病历书写。

2.建立测评基线

需求评审通过后,由医生助理按临床科室分类准备测试用例,数据来源包括真实病例和公开数据集,每个用例包含预期输出标准。结合临床医生意见,制定模型输出内容的评价标准,涵盖问诊逻辑、临床重点覆盖、鉴别诊断准确性、建议合理性和病历书写规范性五个维度。

3.数字医生开发

开发初期,首先对候选基座模型进行评估测试。通过小样本测试用例评估显示:模型1评分最高,但因闭源特性需在线API调用,不符合院内部署要求;模型2参数量庞大,推理资源需求高,使用成本昂贵。最终确定的技术路线为:(1)选用参数规模较小的开源模型3作为基座模型,采用监督微调方法进行能力增强;(2)采用多智能体架构开发数字医生应用。

24.jpg

图3 基础模型能力评估

在模型微调阶段,参照医生诊断逻辑流程:收集基本信息→采集主诉病史→评估诊断置信度→依据临床指南补充询问→推断诊断结论→生成诊疗建议,基于院内真实病历数据开发智能体应用自动合成训练数据,结合人工标注构建高质量微调数据集进行模型监督微调。

智能体开发阶段,运用提示工程实现角色设定、回答约束和问诊逻辑控制,采用RAG技术检索增强知识库,通过函数调用对接业务系统,最终借助工作流编排构建多智能体协作系统,实现需求定义的要求。

4.场景验证测评

应用开发完成后,基于测试用例使用自动化测试框架,结合人工复核,对比AI数字医生输出与预期结果,内部测试完成后,选取1-2个科室试运行并监测效果。

试运行期间,通过应用观测真实环境中的问题案例(Bad Cases),分析错误原因,进而改进提示词、优化工作流以提升性能。例如,通过优化提示措辞、添加示例或增强约束引导模型生成更理想的响应;在工作流中添加对话记忆机制保存上下文增强模型记忆能力;部分场景在提示前增加检索步骤,从外部知识库获取信息后输入LLM。

5.数字医生应用上线

试运行完成以后,数字医生正式上线应用,整个应用包括患者场景和医生场景。

25.jpg

图4 患者端数字医生预问诊示例

26.jpg

图5 数字医生门诊工作站示例

6.持续迭代优化

数字医生上线后,系统持续与真实用户交互,记录模型建议与医生实际诊断、医嘱等信息,这些真实世界数据被持续用于模型强化学习,不断扩展模型认知边界,使系统越来越符合患者和医生预期。

7.AI应用开发技术架构

27.jpg

图6 AI应用开发技术架构

在具体应用开发中,华西二院采用华西数医AI应用开发平台完成开发工作。该平台支持从算力调度、数据准备到模型训练的全流程管理,同时集成提示词工程、工作流管理、RAG知识库等功能,提供低代码开发环境,并包含评测中心和运营观测中心,实现数字医生全流程一站式敏捷开发与管理。

未来趋势

在实践中,华西二院发现通过深度挖掘大模型的潜力,结合人类专家知识实现人机共智,这将深刻重塑医疗行业的智能化格局,具体趋势如下:

趋势一:在医疗场景中落地,通用大模型的小型化和高效化将是必由之路。大参数模型虽然具有强大的性能,但这些模型动辄拥有数千亿参数,其计算成本高昂且资源消耗巨大,通过模型蒸馏将更强更大的模型(如671B)知识和推理能力迁移学习到小参数量模型(如14B、7B),在此基础上再进行专业知识监督微调得到的小参数模型,在专业方面能达到大参数模型的效果,但会极大地降低硬件资源要求。

趋势二:高质量数据合成是医疗大模型开发和训练的基础。开展模型训练,关键在于获取面向医疗领域的高质量数据集。传统上这些数据主要依赖专业医生的人工清洗和标注,效率低下且成本极高。华西二院通过角色模拟算法设计,将院内真实病历、检验检查等数据利用大模型进行深度合成,最后经人工审核后再用于模型训练,提升了训练效率。

趋势三:自然语言编程将成为主流开发语言。在应用开发方式上,传统的软件工程方法正在转向以大模型为核心的自然语言编程范式,包括提示词工程、函数调用和MCP协议等,基于自然语言的开发方式使应用开发更加直观高效,开发者与模型之间实现了真正的协同工作。

趋势四:多场景智能体与多智能体协同将重新定义系统开发模式。华西二院大模型应用场景还在不断增加,如诊前就医事务咨询、导医导诊,诊中智能陪诊,诊后随访,门诊、住院电子病历书写等,这些场景均由不同智能体实现,单一智能体也正演进为多智能体协同架构,这种架构下的智能体能够独立决策、协作互动,以群体智能的形式支持医疗服务。

趋势五:人机共智将变革医疗服务模式。大模型技术的优势在于通过海量数据训练,内化了医学知识并能准确分析这些信息的相关性,有效弥补了人类在知识学习、信息检索和经验积累方面的局限性,带来了医院信息系统交互模式的根本性变革。智能体将作为医生的第二智能,主动参与医疗决策,医生将与数字医生智能体建立人机共智的协作关系。这也要求医院信息化系统建设方法论进行重大转型,从传统的以软件功能交付为核心,全面转向以大模型和智能体驱动的智能医疗服务体系为核心,实现真正意义上的医疗智能化转型。

作者简介

28.jpg

吴邦华,四川大学华西第二医院信息管理部部长,高级工程师,信息项目管理师。中国医院协会信息专业委员会常务委员,中国卫生信息与健康医疗大数据学会数字健康与医疗信创分会秘书长,中国医学装备协会物联网分会副秘书长,四川省卫生信息学会副会长,四川省医院协会信息化建设分会副会长。