15.海南省人民医院:基于语义分析的电子病历智能检索系统【CHIMA 2019案例分享】
案例提供:海南省人民医院
由于历史原因,医院同时运行着过百种医疗业务信息系统,这些多源、异构的系统彼此割裂,致使各种医疗数据处于孤岛状态,无法得到有效利用。目前全国大多数医院的电子病历系统只解决了病历电子化问题,没有解决电子病历数据的应用问题。而国家卫计委的电子病历应用水平评价指南已明确提出,电子化之后的交换和共享以及后续数据的挖掘和应用才是决定电子病历的应用水平的重要指标。电子病历智能检索系统在已有电子病历数据的基础上,利用机器学习和自然语言处理技术自动抓取病历中的临床变量,通过将患者分散在HIS、EMR、LIS、PACS等院内系统中的病历记录进行融合处理,以患者为中心汇总到一起重新进行梳理,能以时间轴集成视图方式展现每位患者的门诊、住院病历信息,是一套集临床数据采集、存储、分析、挖掘于一体的,符合临床需求的智能系统,成为大数据临床医疗科研应用的突破点。其探索的以患者为核心的开发建设思路和对大数据的分析、挖掘和利用,逐步将对数据的管理上升为对知识的管理,提升了信息化对临床科研的支撑保障能力,为最终实现精准医疗和智慧医疗服务体系奠定了坚实的基础。
海南省人民医院是海南省最大的综合性三级甲等医院和全省疑难危重症诊治中心,医院迫切希望引入大数据与人工智能等新兴技术,提高医院信息化建设的整体水平。2018年医院与海南易建科技股份有限公司共同组建“医疗健康大数据联合实验室”,以求利用海南省人民医院的优质医疗资源、业务场景和易建科技股份有限公司雄厚的IT技术实力,通过院、企结合的方式实现强强联合,共同进行医疗健康大数据的技术探索和产品研发,促进大数据与人工智能技术在医院的落地应用。
电子病历智能检索系统的概念
电子病历智能检索系统在已有电子病历数据的基础上,利用机器学习和自然语言处理技术自动抓取病历中的临床变量,通过将患者分散在HIS、EMR、LIS、PACS等院内系统中的病历记录进行融合处理,以患者为中心汇总到一起重新进行梳理,能以时间轴集成视图方式展现每位患者的门诊、住院病历信息,是一套集临床数据采集、存储、分析、挖掘于一体的,符合临床需求的智能系统,成为大数据临床医疗科研应用的突破点。其探索的以患者为核心的开发建设思路和对大数据的分析、挖掘和利用,逐步将对数据的管理上升为对知识的管理,提升了信息化对临床科研的支撑保障能力,为最终实现精准医疗和智慧医疗服务体系奠定了坚实的基础。其系统结构如图1所示:
图1 电子病历智能检索系统的系统结构
系统的技术路线
电子病历智能检索系统采用以患者为核心的设计思路,对医疗大数据的分析、挖掘和利用,逐步将对医疗数据的管理上升为对医疗知识的管理,为实现精准医疗和智慧医疗服务体系奠定了坚实的基础。
电子病历智能检索系统涉及到的医院业务数据量巨大,因此本系统采用主流的分布式存储架构进行数据的存储与备份。基于大数据设计理念,在数据采集设计上,充分考虑了目前多元化数据源的复杂情况,主要由医院的HIS、HRP、HIP、CIS 、EMR等系统,还包括人口主索引和互联网采集的数据等院外数据,这些数据主要分为结构化数据库数据源、半结构化数据源、非结构化数据源三大类构成。因此,在数据源采集的设计采用了多模式的采集方案,同时对数据采集过程及数据采集质量进行严密把控,实现数据采集高可用、高速度、高质量的目标,为上层数据分析应用提供拥有绝对可靠性的数据,打好系统应用的第一基础。
从医院业务库中定时抽取到的原始数据,首先进入HDFS进行贴源层数据备份,经过清洗和处理后的数据保存在数据仓库Hive中供后续服务使用,对于传统的业务类型的数据保存在MySQL中,对于需要全文索引的数据保存在MongoDB和ElasticSearch中。
电子病历智能检索系统为医生提供基于ElasticSearch搜索引擎的数据查询工具,用于进行病例回顾或科研分析, 实现智能化检索,同时提供查询授权功能,限制医生的查询时限、范围,并留存查询日志,保护数据安全。
患者360度全景视图在数据整合的基础上,利用机器学习和自然语言处理技术自动抓取病历中的临床变量,以患者为中心将其分散在HIS、EMR、LIS、PACS等院内系统中的病历记录以时间轴集成视图方式展现每位患者的门诊、住院病历信息,是数据的融合展现型应用。基于BS架构开发,提供API服务,可以嵌入到任何业务系统中,包括医生站、医技系统、手麻系统等。依赖于数据中心全量数据整合的优势,临床医生通过患者360度全景视图,不但可以查看当次就诊记录,而且可以对患者历次就诊记录进行回顾性查看,包括门诊和住院全部的就诊记录,让医生对就诊患者的既往就诊情况有完整的了解,极大地提高临床医生的诊疗精度和效率。图2为系统实现的技术路线:
图2 电子病历智能检索系统的技术路线
系统实现的主要功能
电子病历智能检索系统能实现医疗数据的快速检索,提供基于医疗大数据平台的病历智能检索服务,方便医生快速检索海量病历记录,医生可以在任何办公终端调阅患者的就医全流程及就诊资料,从而从电子病历中获得最真实、连续、完整的的数据,为医院临床科研提供决策支持,同时为临床科研和医疗知识图谱打下坚实的基础。
系统提供的相似病历分析功能以就诊事件为单位,比对患者间的就诊事件的相似度,对同一科室的就诊事件进行相似度分析,当前相似度分析只针对诊断和医嘱,并根据权重值进行评分,最后加权平均求得病例间相似分数,方医生检索处相似病历。
系统还提供患者360度全景视图功能,可以嵌入到任何业务系统中,包括医生站、医技系统、手麻系统等。临床医生通过患者360度全景视图,不但可以查看当次就诊记录,而且可以对患者历次就诊记录进行回顾性查看,包括门诊和住院全部的就诊记录,让医生对就诊患者的既往就诊情况有一个完整的了解,极大地提高临床医生的诊疗效率。
此外,系统引进了知识图谱技术,通过从电子病历中抽取临床知识,通过本体建模方法构建病历图谱,可以把病历数据归纳为患者,疾病,症状,医生,科室,医院,治疗,医嘱,检验,检查,手术,药品,住院事件,门诊事件,体检事件等概念。并通过与医疗知识库相关联,将对医学知识检索、疾病预测、用药推荐和相似病历等打下良好的基础,为临床科研工作者提供些新的结论以供参考,以达到更好地辅助临床医学研究的目的。同时临床电子病历知识图谱是专科知识图谱的基础,从临床病历中抽取专科电子病历知识图谱结合专科知识库构建专科知识图谱。图3为知识图谱的应用情况:
图3 电子病历智能检索系统中的知识图谱应用
系统应用效果评价
电子病历智能检索系统从2018年下半年开始在海南省人民医院上线运行,已经完成了近50万份电子病历的后结构化处理,整合临床医嘱和检验检查结果约650万条数据。系统集成了HIS、EMR、LIS等业务系统的院内数据,以及电子健康档案、全员人口库等院外数据,重构数据模型,以患者为中心重新整合,实现患者360全景健康视图,为患者和医生提供全方位的数据查看。
系统从数据处理、储存到搜索方式都利用先进、高效的人工智能技术及云计算,有效使用计算资源,能够在短短几秒内响应用户的请求,处理百万、乃至千万级别的医疗电子病历数据,为管理、教学、公共卫生提供了良好的数据源。电子病历智能检索系统的应用提升了信息化对临床科研的支撑保障能力,为医生深入挖掘医院医疗数据价值提供可能,为最终实现精准医疗和智慧医疗服务体系奠定了坚实的基础。