16.陆军军医大学第一附属医院:大数据驱动的临床智能辅诊系统研发与应用【CHIMA 2019案例分享】

发布时间:2019-06-13
浏览次数:

案例提供:陆军军医大学第一附属医院

案例概要


近年来,大数据已变成驱动我们数字生活发展的动力和未来科技创新的重要方向,特别是医疗健康领域的大数据具有广泛的应用潜力。陆军军医大学第一附属医院基于医院海量真实病例数据,结合医学文献、临床指南、专病库等知识库,研发了大数据驱动的临床智能辅诊系统,为医生诊疗过程提供多维度数据的辅助决策。


系统充分利用大数据技术,对海量医疗数据进行采集、存储、清洗、语义分析、后结构化处理,并对诊疗过程具有重要参考价值的用药知识、诊疗知识、临床指南和医学文献等数据进行多元化的处理与集成,力求为医生提供全景式的客观数据展示与知识参考。通过及时、有效地建立大数据驱动的知识体系,突破数据集成技术的难点与限制,形成安全有效的大数据驱动的新型精准诊疗模式临床应用范式,突破医疗大数据分析方法与应用的制约点,形成了在临床智能辅助方面有价值的应用,实现覆盖诊疗过程的实时辅助诊疗决策,有效降低误诊率,提升临床诊疗水平及效率。


解决问题


在大数据时代,数据更新之迅速远远超出了个人的学习和接受能力,大量新的医学论文发表,新的临床研究数据发布,令临床医生应接不暇。当前,从医疗大数据的处理到利用还需迫切解决以下问题。


1.医院已积累的海量医疗数据缺乏有效深度利用。


绝大多数医院经过近二十年医疗信息化的发展积累,形成了大量结构化和非结构化的数据,且随着可穿戴设备监测数据、基因测序数据等新模态数据的出现,医疗大数据的增长更为迅猛。然而,医院临床数据的利用水平不高,绝大部分数据处于“沉睡”状态,不能进行临床决策支持与科研,更没有对数据进行知识发现并转化为知识。


2.现有信息环境难以满足诊疗过程中的知识需求。


现有诊疗过程中,医生对辅助知识的获取方式和内容都非常匮乏,特别鲜见使用广泛的医学知识推荐和查询,且缺少实用的知识服务手段。而实质上,临床诊疗工作中,有大量的知识需求亟待通过计算机来提供,这其中就包括基础知识库、临床诊疗知识库、参考文献和从历史病例挖掘形成的知识。


3.传统技术手段不能支撑智能、高效的知识获取方式。


传统数据处理的技术手段只能应对相对少量的医学数据,如果医生在诊疗过程中获取知识的效率太低,医生一般都会选择尽可能少用。因此,我们需要利用最新的医疗大数据技术,构建一套高效的知识获取系统,实现对医生知识需求的快速响应,并尽可能做到智能化,即能够智能感知诊疗过程,精准的为医生提供知识服务。


数据内容


临床智能辅诊系统,是基于我院医疗大数据平台和医院海量真实病历数据,结合医学文献、临床知识库等资源,利用分布式存储和计算、自然语言处理、机器学习等技术构建的,深入挖掘医院近20年累积的大量优质历史病历数据,并融合医学知识库,涵盖文献、指南、循证医学证据,系统囊括了8种癌症的临床指南,1070余条医学知识规则,可链接近2000万份电子病历文档资料和400多万篇文献摘要及70多万篇文献全文。


系统架构如图1所示,包括在线智能引擎架构、离线数据处理架构两部分。


图1 临床决策支持系统系统架构


其中数据源来自我院大数据平台和链接的各类知识库文献库等,系统通过CDSS引擎模块调取数据。在线智能引擎部分主要负责根据医生实时输入,通过实时处理计算,完成诊疗行为推荐、相似病历统计、检索等功能,并将结果展示给医生,该模块在客户端包含辅助决策客户端程序,服务端包含CDSS引擎模块。离线数据处理部分主要按照一定周期或人工触发后,获取海量临床病历、文献知识等原始数据,按照算法设计的规则清洗数据,提取关键信息,并训练算法模型,使得在线系统可以调用算法模型实现特征提取和诊疗行为推荐。

关键技术


1.医疗大数据集成与处理基础技术


将医院HIS、EMRS、LIS、PACS 等医疗数据通过ETL工具进行抽取、汇集、结构化,映射到兼容国际国内医疗数据规范标准的全局Schema中,对字段信息清洗和语义归一,为上层应用服务提供准确的基础数据支撑和业务模型训练。采用了Hadoop技术框架搭建分布式计算,利用22台服务器组建大数据处理平台,共225T存储空间,进行数据采集、清洗、处理、存储等工作。


2.多元异构医学数据的后结构化处理与分析技术


通过自然语义处理技术,结合医疗专业术语的语义结构,将医疗语义信息从原始的自然语言表达,扩展分析为结构化的Key-Value模式,为后续的应用、挖掘、机器学习提供基础数据支持。对2600多万份病历数据建立临床专业语料库,构建数据索引,并进行结构化与归一化处理,为大数据应用、挖掘、机器学习提供结构化数据。


3.构建诊疗过程知识生成的智能算法与规则体系


采用聚类、分类、协同过滤、推荐等算法分析数据结构,对不同的医学数据进行标注,进而建立分类数据集;再结合数据集和机器训练,达到新数据自动识别与归类的目的,进而为临床诊疗活动挖掘出符合条件的业务模型和知识服务。结合医学数据集结构化字段5792个,通过机器学习实现结构化字段的自定义,拓展符合特定诊疗场景的知识服务。


4.研发大数据驱动的临床智能辅诊系统


基于医院海量真实病历数据,结合医学文献、临床指南、专病库等知识库,研发了大数据驱动的临床智能辅诊系统。系统自动获取患者就诊信息,并为医生诊疗过程提供多维度数据的辅助决策,提供操作便捷、实用高效的辅助工具,与医生工作站进行融合。


应用成果


面向临床医生的辅助决策和推荐系统,支持自动从医生工作站获取当前就诊的患者信息,多维度为医生诊疗过程提供辅助决策,让医生在传统的诊疗环境获得创新的诊疗手段。


1.诊断推荐


根据患者基本信息和主诉、现病史等临床信息,智能推荐疑似诊断,并提供这些诊断的典型症状、常用检查、常用检验以及历史相似病历,如图2所示。


图2 诊断推荐示意图


2.检查检验推荐


根据初步诊断,结合基本信息、一诉五史,自动推荐适合的检验、检查项目,并挖掘展示历史病历中的开立占比及相关文献,如图3所示。


图3 检查检验推荐示意图


3.治疗方案推荐


根据最终诊断自动推荐最佳治疗方案,并挖掘展示各治疗方案在历史病历中的开立占比及相关文献,如图4所示。


图4 治疗方案推荐示意图


4.智能提醒


结合知识库和知识挖掘,智能提醒不适合患者病情的处置和预警,如图5所示。


图5 智能提醒示意图


5.病历分析


根据患者主诉、现病史、诊断、检查检验、用药等信息,基于历史数据找出相似病历及各维度的统计数据,如图6所示。


图6 病历分析示意图


6.知识搜索


提供最新最全医学文献、临床指南、临床路径等循证医学知识,如图7所示。


图7 知识搜索示意图


应用成效


本案例研发的大数据驱动的临床智能辅诊系统,突破了医疗大数据分析方法与应用的制约点,为终端用户提供了功能较实用、简便图形化界面的诊疗决策辅助工具,形成了在临床智能辅助方面有价值的应用,对精准医疗的进一步实施与实现具有有价值的参考意义。截止目前,系统已在医院各临床科室推广使用,已累计为医生诊疗行为服务8万多人次,为临床医生和患者带来了较好的就诊体验。


首先,临床智能辅诊对临床医生特别是年轻医生、临床实习生和轮转医生都有很好的指导作用,可以让他们学习已经积累的先进经验,并可同时了解到国内外研究进展与治疗规范,帮助其在临床工作过程中不断提升诊疗水平。


其次,基于医疗大数据的智能辅诊应用会使医生的诊疗过程更加科学、合理、精准;特别是形成了更加有针对性的检查、用药和治疗方案,可进一步减轻患者负担,节约就诊时间,也可进一步提升临床工作效率,提升床位周转率。


再次,该系统的研发大大提升了临床诊疗的信息化环境水平,通过大数据、人工智能等相关技术的集成与应用,使得医院临床诊疗信息化向智慧医疗、精准诊疗方向进一步探索,形成了新技术应用的知识储备。


下一步计划


将临床智能辅诊系统深度融合到诊疗流程中,不断扩充、完善包括影像、生物样本库等在内的各类医疗数据,进一步利用大数据与人工智能技术提升系统的智能化与亲和度,提高整体辅诊能力。


同时,此系统可进一步拓展应用到各基层医疗机构,实现将大型医疗机构的丰富临床经验与知识辐射到基层,对提升基层医生的诊疗水平,带动区域内整体医疗水平的进步具有十分重要的参考价值,市场前景也较广阔。