北京友谊医院:基于DeepSeek的医学影像报告辅助生成与智能知识问答场景创新应用

发布时间:2025-11-17
浏览次数:

一 项目简介

  首都医科大学附属北京友谊医院(简称“北京友谊医院”)创建于1952年,是新中国成立后由党和政府建立的第一所大型综合性医院,现已发展成为北京市属三级甲等综合医院。智慧医院建设脚步的不断加快,以及大语言模型技术的飞速发展,为医院提高服务质量和诊疗效率提供了新机遇。本项目以云算力下DeepSeek模型为基础,选取医学影像报告辅助生成场景、医院自有知识库构建智能知识问答两个场景进行创新应用。

  医学影像报告辅助生成场景:针对医学影像报告领域医师报告撰写工作量大效率低、报告质量监控难、报告数据价值未充分挖掘等挑战,医院开发了基于大模型的医学影像报告辅助生成及智能挖掘系统。该系统全面覆盖医院影像中心各院区,装机量330余台,医生月使用约1万人次,同时通过北京市医学影像质控中心辐射至区域医疗机构,有效提升了影像报告效率和质量。

  智能知识问答场景:针对内部存在知识分散、获取效率低下等难点,医院构建了基于DeepSeek和RAG(Retrieval-Augmented Generation)技术的智能知识管理与问答系统,整合医院规章制度、通知公告、临床指南等各类资源,构建安全、统一的院内专有知识库,借助DeepSeek强大的通用知识储备与RAG增强检索技术,实现智能问答、知识推荐等功能,为医院员工提供高效、便捷的知识服务。

二 建设与开发

  1.系统架构

1.jpg

图1 云算力下基于DeepSeek的医学影像报告辅助生成与智能知识问答系统架构图

  (1)DeepSeek大模型算力后台

  部署于北京市健康云——门头沟机房算力中心,通过专线与医院网络互联,确保数据安全和低延迟响应。医院部署了完整版DeepSeek通用模型以及山海大模型蒸馏版DeepSeek。其中,完整版DeepSeek通用模型用于智能知识问答场景,山海大模型蒸馏版DeepSeek基于影像数据进行预训练与微调,用于医学影像报告辅助生成场景。

  (2)应用服务器端

  放射报告生成与质控场景:负责与医院PACS进行集成,并实现语音报告生成以及质控功能。

  智能知识问答场景:负责与医院OA系统及集成平台对接,实现知识库的存储、管理、用户角色及权限控制。

  (3)用户前台

  医学影像报告辅助生成场景:放射科医生通过本地客户端与院内PACS进行集成,实现语音放射报告生成。

  智能知识问答场景:医护人员通过浏览器网页访问,实现智能问答、知识检索等功能。

  2.医学影像报告生成场景

  (1)项目立项和准备阶段(2022年10月-2023年6月)

  2022年10月,项目正式启动。通过文献综述、专家访谈、实地考察等方式,收集整理了近5年的历史影像检查数据和报告文本,经过数据清洗和脱敏处理,构建了实验语料库。

  (2)项目调研(2023年6-8月)

  通过为期1个月的现场调研和需求访谈,详细了解北京友谊医院影像中心的工作流程、报告规范、质控要求、接口规范等,形成需求调研报告。

  (3)技术模块实施阶段(2023年8-11月)

  从医院PACS/RIS抽样获取2015年以来的1万份历史影像报告数据,采用医学文本数据清洗、脱敏工具对原始数据进行结构化处理,构建2亿token规模的影像报告语料库,并在此基础上采用增量预训练、指令微调等技术构建针对影像报告业务优化的本地化大模型。

  (4)流程再造和系统集成阶段(2023年11月-2024年3月)

  与影像科、超声科选定基于CT、MR、X线、超声等4个模态的试点应用,制定新流程试点的时间表,明确切换范围、步骤等,形成流程试点计划。面向影像科全体医护人员、PACS管理员、质控人员等举办4场系统操作培训。

  (5)运行和功能优化阶段(2024年4月-2024年12月)

  试运行期间收集整理系统运行故障、用户反馈等问题,按照严重等级确定优先级和解决措施,形成问题处理日报,及时反馈进展。

  (6)项目推广阶段(2025年1月-2025年4月)

  基于本项目在北京友谊医院良好的应用效果,医院通过北京市卫生健康委以及北京市医学影像质控中心积极向北京市内其他医疗机构进行推广。为此,本项目将原部署的山海大模型基座进行了升级,将通用DeepSeek中知识和推理能力进行蒸馏,并将其部署方式改为云算力部署,进一步提高项目的可用性与推广性。

  3.智能知识问答场景

  (1)项目立项和准备阶段(2024年6-8月)

  2024年6月,北京友谊医院将本项目成功纳入其2024年度高质量发展先锋改革举措中,由医院医学数智创新中心、信息中心合理分工协作。

  (2)实施与开发阶段(2024年8月-2025年1月)

  开发、实现基于RAG的知识管理与问答系统。面向全院征集已有知识库,完成知识库初始化,实现与OA系统的联调,支持科室知识上传与审批。

  (3)项目试点与升级迭代阶段(2025年2月-至今)

  以财务系统、HIS系统以及护理专科知识库作为试点,进行试用和测试,并实现项目的迭代升级。

  4.技术亮点

  RAG技术:通过量化检索和上下文增强生成结合,显著提升问答准确率。

  数据安全:依托政务云协议,确保所有医疗数据在传输和存储过程中符合国家信息安全标准。

  闭环知识管理:从知识采集、标准化处理到用户反馈,形成完整的知识生命周期管理。

三 产品描述

  1.放射报告生成场景

  本场景包含三大核心技术模块,构成了面向影像诊断全流程的智能报告辅助技术体系:

  (1)基于自混合注意力解码器的影像科医师口述语音精准识别技术

  针对医学影像专业术语复杂、嵌套短语多、否定词依赖关系远等特点,创新提出SMAD技术(Self-and-Mixed Attention Decoder)。该技术在解码中引入文本和声学的混合注意力机制,结合CTC Prefix beam search算法获得最优识别结果。

2.jpg

图2 医学影像报告辅助生成系统流程图

  (2)融合大语言模型的智能影像报告生成技术

  系统通过指令微调、关键信息对齐和Agent智能体等技术,解决了传统自动报告系统在理解医学影像报告逻辑混乱、内容幻觉、表达不规范等问题。采用多阶段任务拆分方法进行过程监督:首先提取医生口述中的关键医学信息,利用医学知识库进行验证对齐;然后将提取的关键信息与影像学专业模板结合,生成符合临床规范的标准化报告。

3.jpg

图3 采用长时语音增强技术

  (3)基于Query重构技术的影像学报告质控方法

  本项目突破传统质控依赖静态规则的局限,提出基于Query重构的智能质控方法。该方法通过多阶段处理流程,对影像报告进行深度语义解析和重构。系统首先利用医学实体识别算法,精准提取报告中的关键词和短语,建立结构化知识表示;然后通过知识增强检索技术,将提取的医学实体与知识库进行高效匹配,综合运用语义检索和关键词检索策略,捕捉各维度的实体信息。

4.jpg

图4 基于Query重构技术示意图

  质控过程中,系统通过Prompt工程将报告拆解为一系列推理步骤,对每步逻辑进行严格校验,提高了整体纠错能力。结合深度学习和知识图谱技术,形成了整体联动、主动进化的质控知识体系,实现了报告质量的精准评估与实时反馈,有力推动影像报告流程的规范化发展。

  2.智能知识问答场景

  (1)功能架构

5.jpg

图5 智能知识管理与问答系统功能架构图

  系统包括管理者和用户两个角色:

  管理者(各科室的知识库管理专员以及医院信息系统运维团队):负责知识库构建,包括文档标准化、文本分割、向量化存储及持续更新。

  用户(医院职工):通过智能问答界面快速获取精准知识,系统支持问题分类、相似性检索及满意度反馈。

  (2)知识库构建流程

  通过闭环式知识构建过程实现知识库的原始积累以及持续更新,并通过文档标准化、文本分割及向量化将获得的知识库存储至向量数据库中。院内知识库来源有两种:一种是医院OA系统中公开的通知、公告信息,经科室主任审批后,会在OA首页进行推送,并将信息同步存储于系统向量知识库内;另一种为科室的知识库管理专员开放的“知识库申请流程”。经科室主任审批通过后,仅推送至系统向量知识库,用于医院职工的问答服务。

6.jpg

图6 知识库构建流程图

  (3)智能问答流程

  用户在访问终端中输入问题,系统在获得用户的问题后,首先通过问题向量化和相似性检索从向量数据库(知识库)中检索与问题相似的知识;然后通过重排和过滤筛选出最相似的知识作为上下文与用户的问题一起输入到大模型中生成回答;最后,在用户获得答案后,系统还会对用户满意度进行调查,以对知识库中知识的准确性进行评估和反馈。

7.jpg

图7 智能问答流程图

四 应用效果

  1.医学影像报告生成场景

  (1)提升诊断效率,改善医患体验

  智能报告系统将传统影像报告流程从"阅片-记录-整理-审校-发布"5步缩减为"阅片-口述-发布"3步,医生工作效率显著提升,报告时间缩短约30%-40%。北京友谊医院影像科实测数据显示,使用系统后,医生可将更多时间投入核心诊断活动,日均处理病例增加10-15例。

8.jpg

图8 2024年5-6月北京友谊医院门急诊影像报告平均时间

  (2)规范报告质量,赋能区域质控

  基于大模型的智能质控系统能精准识别报告中的语法错误、敏感词、逻辑矛盾等问题,实现实时预警提示。与北京市医学影像质控中心合作后,医院通过API接口将质控结果实时反馈至质控平台,使质控人员能实时监测全市报告质量状况。

  传统人工进行的报告问题抽检率大约为10%,系统将抽检率提高至30%。针对全市CT、MRI、超声等各类检查建立了科学评价指标体系,生成质量分析报告,为质控决策提供了精准依据。这一成果正通过北京市医学影像质控中心向北京市各级医疗机构辐射推广,推动了影像质控行业标准和评价规范的建立健全。

9.jpg

图9 影像云平台质控监控视图

  2.智能知识问答场景

10.jpg

图10 智能知识问答系统2025年4-10月的用户访问量

  智能问答系统于2025年2月20日上线试运行,截止到10月底,每日用户访问量约3000次,累计获得近70万次系统访问记录。用户医学问题约占98%,其中,内科系统问题占比最大,超50%;其次为外科系统以及医技系统问题。

11.jpg

图11 用户问题分类

  目前,北京友谊医院已收集、更新了包括财务系统、HIS系统、护理专科知识库等12个科室的专有知识库。

12.jpg

图12 知识库建设

五 总结

  本项目基于云端DeepSeek大语言模型,聚焦医学影像报告辅助生成和智能知识问答两大核心场景,推动医院数字化转型。

  在医学影像报告辅助生成方面,针对传统报告撰写效率低、质控难、数据价值挖掘不足等问题,项目团队开发了基于大模型的智能报告生成及分析系统。该系统已覆盖全院影像中心330余台设备,月均使用超1万人次,显著提升报告生成效率与标准化水平,并通过北京市医学影像质控中心向区域医疗机构推广,形成示范效应。

  在智能知识问答方面,为解决医院内部知识分散、检索效率低下的痛点,项目创新性采用DeepSeek与RAG(检索增强生成)技术,构建了统一的院内专有知识管理平台。该系统整合规章制度、临床指南等异构数据资源,通过大模型的通用知识理解能力和RAG的精准检索增强,实现智能问答、知识主动推荐等功能,目前已在财务、护理等重点科室试点应用,成为医院知识管理的核心基础设施。

  本项目的成功实施,不仅为北京友谊医院高质量发展提供了智能化支撑,更探索出可复制的"AI+医疗"创新模式,为行业数字化转型贡献了宝贵经验。未来,医院将持续优化系统功能,深化临床场景应用,助力国家智慧医疗建设目标的实现。

  (来源:CHIMA 2025医院新兴技术创新应用典型案例集)