01.北医三院:基于全量数据中心及人工智能技术的辅助临床决策支持 【CHIMA 2019案例分享】
案例提供:北京大学第三医院
案例概要
在国家政策及大数据、人工智能技术发展的驱动下,北京大学第三医院结合医院实际需求进行临床决策支持研究,建立一套契合临床诊疗流程、高效实用的综合性临床决策支持体系,以提高诊疗效率、减少医疗差错、提升医疗质量。系统基于全量数据中心,深入挖掘医院10年来累积的大量优质历史病历数据,并融合全球权威BMJ循证医学知识库,在双引擎驱动下,实现智能化诊断及治疗的辅助决策。构建综合预警规则平台,实现诊疗全过程综合预警提醒。搭建智能化病历内涵质控平台,实现实时统一的病历内涵质量控制。建设基于院内主数据的标准化术语本体,实现融入业务系统的基于语义的知识检索服务。在多系统集成及海量数据支撑的基础上,实现覆盖诊疗全过程的实时辅助诊疗决策,有效降低误诊率,提升临床诊疗水平及效率。
解决问题
有研究表明,因决策失误所致的用药错误或处置不当是造成医疗差错甚至责任事故的重要原因。随着医院就诊人次攀升和向患者提供优质服务的需求,降低误诊率,临床决策支持系统成为各大医疗机构关注与发展的热点。现行临床工作在很大程度依赖于临床经验,承担一线工作的低年资医生临床经验不足、医学知识体系不完善,需要基于循证医学实践及医院临床实践的便捷辅助决策支持工具。
数据内容
临床决策支持系统(CDSS),基于全量数据中心,采用自然语言处理技术、神经网络、随机森林等机器学习算法,深入挖掘医院近10年来累积的大量优质历史病历数据,并融合全球权威BMJ的循证医学知识库,涵盖文献、指南、循证医学证据一千四百多万条,制定全科及专科预警规则近2万条。
该系统从底层数据到顶层应用的系统架构如下图所示。底层由数据中心、BMJ知识库、临床指南作为数据基础,经过数据处理,整合得到:临床最佳实践库和循证医学最佳实践库。通过算法分析、构建模型,搭建后台支撑体系,支持前端临床应用。如图1
图1 临床决策支持系统系统架构
关键技术
1.病历多层次医疗术语抽取
病历文书及检查报告利用的基础在于非结构化文件的处理,这里使用病历多层次医疗术语抽取方法,在本体的术语标准化基础上,以极细的颗粒度,对症状、体征、持续时间、治疗手段、治疗效果等实体进行提取,并按照时间关系加以组织,最终完成病历的后结构化处理,为形成医院临床最佳实践库提供数据支撑。
2.双引擎驱动的辅助诊疗决策推荐
CDSS基于真实最佳临床实践案例和BMJ循证医学知识库双引擎驱动,在病历多层次医疗术语抽取的基础上,深入挖掘我院10年来累积的大量优质历史病历数据,融合权威BMJ循证医学知识库,利用神经网络、随机森林等机器学习算法来搭建诊断及治疗方案推荐模型,实现智能化诊断及治疗的辅助决策。
3.临床数据实时处理
CDSS提供的诊断、治疗方案推荐,预警提醒,病历质量监控等,要求有一定的实时性,系统根据当前患者的病历、检查/检验指标变化,提供及时推荐和提醒。比如,对于病历内涵质控,当临床医生书写病历时,辅助临床决策系统需完成与应用系统的数据传输,系统的数据处理及结果返回。对临床应用系统与临床决策系统之间的信息交互提出更高要求,对临床决策系统的处理服务提出更高要求。
4.系统异步通讯
CDSS与临床应用系统采用异步通信,在提供推荐、提醒服务的同时,不影响临床业务处理速度,提供非打断式提醒服务。
应用成果
CDSS建立诊疗模型,搭建预警系统,构建规则应用平台、病历质控平台、知识检索平台。在多系统及平台的支撑下,实现面向临床的辅助临床诊疗决策、多维综合临床预警预测、实时统一病历内涵质控、语义知识检索服务。
1.双引擎驱动实现智能化诊断及治疗的辅助决策
结合当前患者病历,借助双引擎驱动,实现诊断决策导航,包括:诊断概率列表直接推荐、检验检查项目推荐辅助确定诊断、鉴别诊断推荐验证诊断,如图2。通过提供有概率比较的诊断列表,以及多渠道验证机制,辅助临床确定诊断,减少误诊误治。
图2 诊断概率列表推荐
循证医学知识库检索+历史病历挖掘双引擎驱动,辅助临床进行治疗决策。结合当前患者的主诉、既往史、现病史、辅助检查等内容,以临床指南治疗为基础,通过学习BMJ循证医学知识库以及我院相似病例经典治疗方案,如图3、4所示,辅助临床形成精准化、个性化的治疗方案。
图3 循证医学知识库+个性化治疗方案推荐图
图4 历史相似病例推荐
2.构建综合预警规则平台,实现诊疗全过程综合预警提醒
构建综合预警规则平台,制定异常指标、预警提醒规则近2万条,实现异常指标、预警提醒规则的可配置管理;利用自然语言处理、机器学习算法提取患者检验、检查及文本信息的后结构化数据,对临床诊断、用药、检验、检查等处置方案进行规则判断,实现诊疗全过程综合预警提醒。通过提取历史相似病历危急重情况的相关数据,监测患者各项指标变化,预测患者病情发生及发展成危急重情况的概率,如图5、6所示。
图5 预警提醒图
图6 病情快速进展评估
3.搭建智能化病历内涵质控平台,实现实时统一的病历内涵质控
搭建智能化病历内涵质控平台,建立基于国家病历质控标准为核心的病历内涵质控规则引擎。通过对病历结构化解析,实现实时、统一标准的病历数据的智能化问题检出,辅助临床医生在书写病历环节及时发现缺陷、修改缺陷,有效提高病历书写质量,如图7所示。
图7 病历质控实例
借助病历质量监控平台,帮助病历质量管理者实现全院高效病历质量水平监管,如图8所示。
图8 病历质控监控平台
4.提供融入业务系统的基于语义的知识检索服务
在院内主数据标准化基础上建设标准化术语本体,完成疾病、药品、体征同义及层级关系的对照,有强大的医学知识库支撑,并将检索服务集成于业务系统,提供融入业务系统的基于语义的知识检索服务,如图9所示。
图9 基于语义的知识检索
应用成效
分析2017年的既往病例,诊断推荐的第一命中率为75.46%,前三命中率高达87.53%。推荐诊断准确率高。分析上线前5个月24个病区初诊准确率为70.4%,如图10所示。上线后5个月相同病区的初诊准确率为72.6%,如图11所示。提高了初诊准确率。分析上线前5个月24个病区平均确诊时长为3.25天,上线后5个月相同病区平均确诊时长为2.27天,减少近1天,如图12所示,缩短了确诊时长。其中,第一命中是指出院主诊断位于推荐诊断第一位,前二命中是指出院主诊断位于前二位,同理为前三命中;推荐诊断准确的判定为推荐诊断是出院主诊断或上一级诊断;初诊准确率的判定为入院主诊断等于出院主诊断;确诊时长的确定方式为文书中记录确诊的上级医师查房记录时间减入院时间。
图10 推荐诊断准确率图
图11 初诊准确率比较图
图12 确诊时长比较图
分析上线前后10个月6个科室24个病区的病例,推荐诊断平均覆盖总诊断数的81%,如表3所示,覆盖疾病广。在有诊断推荐的病历中,各年龄段的前三命中率平均86.44%,命中比例高达93.33%,如表4所示,推荐诊断覆盖全年龄段。其中,诊断数指病例中出现的诊断数量;推荐诊断命中数指有推荐诊断并命中的诊断数量;推荐命中占比=推荐诊断命中数/诊断数*100%;前三命中比例指出院诊断出现在推荐诊断列表前三位的百分比;命中比例指出院诊断出现在推荐诊断列表中的百分比。
表3 推荐诊断与总诊断数的占比表
表4 各年龄段推荐诊断命中情况表
分析上线后5个月6个科室24个病区的病历,医生平均修改率为73.41%,如表5所示;将某科上线后2018年12月问题数与2017年12月病历问题数比较,从308降到105,减少了66%,如图13所示。
表5 上线后5个月6个科室医生修改率情况表
图13 上线前后问题病例数比较
通过推荐诊断准确率、初诊准确率、确诊时长3个指标来评估智能辅助决策推荐诊断的有效性,从推荐诊断覆盖率、年龄段覆盖率2个维度来分析推荐诊断的适用性,从病历平均修改率和病历问题数2个角度分析病历质控有效性。通过这些数据分析,可以看到辅助诊疗体系对临床工作起到了较好的辅助作用。
下一步计划
进一步探索临床决策系统应用,为临床提供更多基于大数据及人工智能技术的便捷有效工具;继续探索利用医院海量数据资源及人工智能新技术在医院的新应用,更深入地解决临床医疗、医院管理等问题。
【CHIMA 2019】关于召开“2019中国医院协会信息网络大会暨中外医疗信息网络技术和产品展览会”(CHIMA 2019)的通知