张啸:当AI叩响医疗信息化的门扉——医信人的破局之路
AI浪潮下的医信人焦虑与破局之道
AI浪潮已然席卷而来,无论是否做好准备,它已悄然渗透进每个角落。作为深耕医院信息化的从业者,我与同行们共享着相似的焦虑:当ChatGPT展现出指数级增长的代码能力,当智能体按需求自动编写Python脚本并修正错误,当AI生成的技术方案和PPT堪比资深专家手笔,我们不禁叩问:未来的信息部门是否会被AI取代?医信人的价值坐标将指向何方?
经过365天的躬身实践,我可以笃定地回答:那些被AI淘汰的从业者,必然是疏于知识沉淀、拙于提出优质问题、抗拒拥抱新技术的群体。而持续进化的医信人,永远能在技术浪潮中找到新的锚点。
作为兼具行政、技术、医技多重属性的复合型角色,本文聚焦于医学信息技术人员在AI模型探索中的技术突破,暂不展开讨论AI在行政办公领域的赋能实践。
AI探索之路:从算力困境到模型部署
2024年初,我和部门一位善于钻研新技术的工程师(姑且称他为“由大神”)开启了AI探索之路。我们共同学习AI知识,我多去了解AI的前沿技术,医疗与AI的结合创新方向,了解国内各大公司的医疗AI进展;大神尝试各种开源模型,尝试不同算法,对模型进行RAG训练和微调。
想要尝试AI,算力就是摆在信息部门的第一扇门,由大神日常需要在电脑上运行多个开发环境,对电脑性能要求很高,2023年底曾自费购买5000元级别独立显卡用于办公和研发,虽然当时DeepSeek还没有横空出世,人工智能方兴未艾,各种大模型如雨后春笋,然而尝试用这种级别的显卡运行Qwen模型无疑是奢望。正当束手无策之时,意外发现医院一台临床科室的科研服务器上配有V100,并且科室对GPU的利用率较低。2024年4月,我们在这台C86上运用Ollama成功部署了Qwen_14B模型,尝试进行医疗相关的问答。
2024年6月,深圳大学总医院依托这台配备V100训练卡、安装了openEuler操作系统和openGauss数据库的C86服务器,针对院内十万余份门诊病历,开展了主诉、现病史、体检信息和诊断结果的提取、数据清洗与标记工作。随后,我们分别采用qwen2_1.5b模型进行LoRA微调、Qwen2_7B模型进行QLoRA微调。经过数月尝试,实践验证显示,挂载微调后模型的qwen2在对新病历进行诊断时,准确率已达到75%以上,为医疗质量控制工作提供了有价值的参考依据。
或许是上述微小的星火,在向院领导汇报后,2024年12月,医院采购了一台配备8张4090 GPU的运算服务器,作为信息部门的AI实验设备。基于前期已处理好的上述医疗数据,我们对Qwen2.5_32B模型进行了微调,进一步提升了智能诊断的准确率。同时,借助SwanLab工具对整个训练过程进行了可视化展示,以便更直观地监测和分析训练情况。
尤为关键的是,凭借强大的算力支撑,我们终于能够全面发力,突破束缚,多线并行推进。
AI模型应用与优化:从医疗诊断到导诊系统
2025年1月底,DeepSeek骤然走红。春节后首个工作日,我们便下载了DeepSeek模型。初生牛犊不怕虎的我们,竟大胆尝试671B模型,然而经过3天3夜的下载,终因算力不足而无法运行。无奈之下,我们转而下载了70B、32B和1.5B模型。深圳大学总医院随后针对此前处理的场景及数据,对DeepSeek_R1_32B模型进行了lora微调,起码不用因为算力不足使用qlora。凭借该模型卓越的推理能力及其内置的丰富医疗知识,智能诊断的精确性得到了显著提升。
2025年2月,全行业均在积极探索AI的步伐,我们也怀揣时不我待的紧迫感,加速推进相关尝试。
1.决定尝试将CDSS的规则引入大模型,并与临床系统相结合,以探索其是否能够替代现有的CDSS。为此,首先导出CDSS知识库,并对临床决策支持系统(CDSS)的规则库进行优化处理。由于CDSS的知识库主要由一系列AND、OR等逻辑表达式构成,大模型难以通过语义理解这些规则。于是,我们首先对CDSS规则库中的表达式进行键值提取,并将其转换为抽象语法树(AST),随后导入数据库,构建新的知识库。
针对可能出现的非标准化输入,我们采取了多种精确匹配策略:
(1)提示词工程与基础模型问答:运用提示词工程方法,通过ollamaAPI与基础模型对录入内容进行结构化处理。在此过程中,基础模型可灵活切换,我们陆续尝试了QWQ_32B、DeepSeek_R1_70B、Gemma_27B、Qwen2.5_32B等多个模型。
(2)嵌入模型尝试:采用pkuseg替代嵌入模型的分词器对医学词汇进行分词。在嵌入模型的选择上,我们尝试了BGE、微软的BiomedNLP、Qwen2.5_3B的微调模型、Google的中文BERT模型、华佗1.5B等。
(3)词向量字典匹配:借助多个医疗词典的词向量字典进行匹配。
(4)AST库匹配:最后运用AST库进行匹配操作。
在计算技术方面,我们采用了多GPU并行计算技术,以提升处理效率。经过一系列探索与尝试,目前中文BERT模型+pkuseg+DeepSeek_R1_70B的组合在匹配效果上暂时表现最佳。
图1 CDSS规则库引入大模型效果
2.导诊是AI在医院覆盖最常见的场景,从尝试探索的角度出发,也有必要自己尝试一遍。初步尝试采用DeepSeek_R1_70B模型,结合Ollama部署框架与AnythingLLM/OpenWebUI交互界面,构建院内智能知识库系统,但效果并不理想(图2)。
图2 利用开源工具实现的科室推荐效果
随后,深圳大学总医院通过自主全代码研发的方式,构建了智能导诊知识库。该系统针对院内科室的简介等信息进行了结构化提取工作。在模型选择方面,基础模型选用了DeepSeek_R1_32B,嵌入模型则选用了BGE_Large。经过实践验证,该智能导诊知识库能够准确理解患者的口述内容,并据此精确地为患者推荐合适的就诊科室(图3)。
图3 导诊推导过程
3.正值深圳大学总医院即将迎来三甲强化辅导,借此机会医院共梳理出621项院级制度。由于制度繁多,涉及医疗、行政、药学、财务、运营、医保等各个维度,使用查找起来非常耗时,我们通过全代码自主研发的方式,成功构建了医院管理制度智能知识库。针对院内数百万字的管理制度文本,我们进行了全自动个性化的切片处理,并将处理后的数据存储于Fassi向量数据库。为了实现大规模数据的精准索引,医院综合运用了多种前沿算法和技术,包括ANN(近似最近邻)算法、自主研发的混合权重算法(兼顾关键字与语义)、Rerank技术以及BM25词频排序算法。同时,选用了BGE-reranker-v2-m3模型和BGE-large-zh-v1.5中文嵌入模型,并通过Ollama API接口调用DeepSeekR170B模型。
在研发过程中,我们对多种算法进行了深度融合,并对多个模型进行了反复尝试与优化。在系统的交互界面设计方面,支持对各项参数进行精细调整,从而提升数据匹配的精确度,使系统生成的回答更加精准。在计算方式上,我们采用单实例加载模型、多进程并行计算的策略,有效提高了处理效率,并降低了显存使用。此外,通过对提问进行多重模型解析及优化提示词工程等手段,进一步提升了知识库的整体性能。
此产品一经推出,参与内测的业务同事最喜欢问我一个问题:这个工具能做什么。“能做什么?我也不知道具体能做什么,就看你的想象力了。”当时医院正值创三甲的关键阶段,医院定期出题进行全院考试(错一题即不及格需补考)。我们最满意的是,每次考试都让AI来帮助作答,它全对就可顺利过关,它出错就需要补考。
图4 RAG医院所有院级制度的问答助手
4.深圳大学总医院在医生站医嘱系统中深度集成了多模态大模型,借助自然语言处理技术,实现了主诉、现病史、体检等诊疗信息的结构化录入,并支持诊断结论的智能化生成。同时,我们构建了智能问答交互模块,能够针对临床场景提供基于医学知识的实时推理支持,辅助医生快速定位诊断要点,为诊疗决策提供数据化参考依据。
图5 根据门诊病历辅助诊断及治疗方案撰写
以上四点是今年2月至3月初一个月的工作情况。在实际医疗工作的多场景应用中,我们对DeepSeekR1、Qwen2.5、Gemma27B、Qwq_32B等不同模型或不同参数版本进行了全面评估,旨在权衡性价比后选出最优方案。
AI时代医信人的展望与期待
今年春节后,在一次信息部门周例会上,我满怀激情地告知部门的15罗汉,AI时代已然来临。掌握AI开发工具将成为未来信息部门的必备技能,无论是通过编写代码,还是利用dify、coze等工具,大家需根据自身情况迅速投入学习。因为未来,任何一个信息系统都有被AI重塑的必要。
3月,深圳大学总医院搭建Dify平台,并在全院范围内开展推广工作,鼓励全体员工参与到智能体(Agent)的开发中来,以充分发挥该平台在医疗业务场景中的应用价值。由于算力有限,培训后的当天下午,系统积累到10个并发时,算力服务器就发生了第一次崩溃。
3月的一天,院长告知我,他了解到DeepSeek可以与PubMed相结合,并希望我们探索其实现的可行性。接到这一需求倍感振奋,因为在AI探索之路上,我们不畏艰难,唯恐缺乏创意与需求。经过努力,我们成功实现了通过提取PubMed摘要并结合AI自身能力,提供更为权威的医学解答。我们暂且将这一产品命名为“【深圳大学总医院PubMed文献查询系统】MeSH术语转换模块”。具体实现方式如下:
(1)采用迭代优化的英文提示词工程,通过Ollama API调用Mistral-Small-24B(尝试各种模型,发现这个法国的小众模型效果最佳)模型,实现用户查询词到PubMed MeSH术语的精准映射,确保生成术语符合NLM词表规范。
(2)在文献数据获取方面,基于PubMed官方API构建数据获取通道,使用OAuth2.0协议完成Google账户授权认证,获取API访问密钥;建立包含PMID批量获取、XML数据解析及特殊字符处理的标准化流程,实现文献元数据的结构化提取。
(3)智能问答引擎:通过多模型能力对比实验,最终选定在特定任务中表现稳定且低幻觉率的Mistral-Small-24B模型。采用多层提示词优化策略,融合用户查询与文献数据构建上下文,确保生成内容的准确性与逻辑性。
图6 AI模型✖️PubMed 本地化工具
未来,希望不只是院领导,还有更多临床和行政人员能深入参与医学人工智能的探索和尝试,提出有创意的应用场景,一起挖掘可能成为热门的应用场景。无疑,算力的限制是广泛部署的难题。可能在您阅读此文之时,更强大的算力正在计划之中,或正在努力争取。AI时代已经到来,医疗信息工作者对探索新技术、新工具的热情始终高涨。
(深圳大学总医院信息技术部数据库与人工智能工程师由默翰对本文也有贡献)
作者简介
张啸,深圳大学总医院信息技术部主任
下一篇: 技术较量,思想洗礼:那些年辩论赛的故事