企业主患者索引解析:理论、产品和实践(下)

作者:叶常青 发布时间:2020-05-07
浏览次数:

叶常青先生撰写的《企业主患者索引解析:理论、产品和实践》比较系统的分析了“企业主患者索引”的发展历程,实施方法和发展趋势,对于医院、医联体、区域电子病历共享建设工作具有一定的参考价值。此文内容丰富,表述详尽,分为上下两篇发布。上篇包括:发展历史、核心模块,核心算法,实施方式;下篇包括:生命周期,主要厂商、创新发展和综述等内容。


相关文章:企业主患者索引解析:理论、产品和实践(上)


05

生命周期


实施步骤

GeneralImplementation Process


根据用户的场景,实现企业主患者索引的解决方案很复杂。有效的实施方案分成很多实施步骤,而且是一个重复迭代的过程直至优化。主要的EMPI产品如Oracle、IBM都给出建议的实施步骤。参见图四。


图四. MDM/EMPI实施步骤(参考IBMInitiate 资料)


EMPI生命周期


有效的企业主患者索引(EMPI)实施不仅仅涉及创建和运行所需的解决方案的应用程序。应用程序就位后,企业主患者索引将继续清洗数据和删除重复数据,并将更新的信息提供给外部系统或上游应用(UpstreamApplications),维护下游应用(DownstreamApplications)的一致性。SunMicrosystems较早提出主数据管理MDM/企业主患者索引(EMPI)的生命周期(Lifecycle),组织EMPI生命周期为三个阶段:创建、同步、联合(Creation、Synchronization、andSyndication)。除了MDM/EMPI生命周期的上述三个阶段之外,还应用三个操作层来控制和监视每个阶段:治理、联盟和分析(Governance、Federation、andAnalytics)。


图五. MDM/EMPI生命周期(参考SunMicrosystems MDM资料


06

主要厂商


企业主患者索引EMPI产品主要分为二大类:开源和商业化。有的企业同时提供开源和商业化版本。主要开源产品包括:SunMicrosystems Mural、iOpenMPDM、OpenEMPI、Talend、SOEMPI等。很多主数据MDM产品并不约束于患者主数据EMPI的应用,而有的专注于EMPI如NextGate、OracleOHMPI、Senzing等。Gartner没有EMPI分类,EMPI归为MDMCDI。相关的商业MDM/EMPI厂商列于表一供参考。


表一. 主要MDM/EMPI厂商


07

创新发展


人工智能和大数据


Fellegi和Sunter的概率匹配方法、企业主患者索引技术和产品都已经基本成熟。大部分厂商产品也已经进入市场很多年。但随着大数据和人工智能的发展,企业主患者索引技术的创新仍然在继续,诸如利用人工智能的新方法解决困难的记录匹配,以进一步提高记录匹配的精度和效率。智能记录匹配是新的方向,但是很多大厂商如Oracle、IBM、SAP、Informatic等并不积极在这方面的投入,投资回报率(ROI)低,因为传统的方法已经能解决了大部分问题。企业主患者索引技术在大数据平台上的应用也是业界关注的问题,数据的重复和不精确表达在大数据平台上一样存在,如何利用HDFS和SPARK技术进行主数据的分布式存储和并行匹配等是需要解决的问题。


下一代企业主患者索引EMPI技术


除了探索人工智能算法为基础的智能匹配方法,业界还在创新完全新的途径。过去几年,也诞生了几家创新企业如Verato采用全新的参考匹配方法提高匹配的精确度和效率,已经被越来越多的用户接受以替代现有的部署,提高现有的部署准确性和效率,减低现有的部署的维护成本。Senzing也是一种高效的新兴EMPI技术,特点是产品简单轻巧,实施、部署快速,运营和维护成本非常低,也已经被越来越多的用户接受。这些创新企业正在挑战传统企业主患者索引厂商,逐步赢得越来越多的市场份额。


云部署的企业主患者索引

(Cloud-BasedEMPI)


云部署或托管式的企业主患者索引减少解决方案的安装、配置、部署、管理和维护的资源,企业主患者索引数据库中心化,总体拥有低成本的优势,将逐渐替代本地EMPI解决方案。海外市场对云部署式的企业主患者索引的需求也越来越高,Verato、NextGate、MeghaData等厂商都提供云部署式的服务。


联合企业主患者索引

(Federated/HierarchicalEMPI)


联合企业主患者索引集成数个独立运行的企业主患者索引系统构建中心企业主患者索引系统。在此场景中,每个独立运行的企业主患者索引是源数据,中心企业主患者索引是主数据系统。这样的场景对企业主患者索引产品提出了更高的要求。目前并不是大多数厂商升级支持这样的场景。


多域的企业主患者索引

(Multi-DomainEMPI)


多域的企业主患者索引源于多域的主数据管理(Multi-DomainMDM),业界并没有多域的企业主患者索引的明确术语,尽管OracleOHMPI和IBMInitiate已经支持多域场景。多域的企业主患者索引就是建立、控制及管理患者索引与相关的主数据以及各主数据间的关系。在企业或医疗机构范围内与患者索引相关的主数据越来越多,参见图六。如何有效地建立、控制及管理患者索引与相关的主数据的关系是很大的挑战。


图六. 多域MDM/EMPI(参考IBMInitiate 资料)


国家患者识别码

(NationalPatient Identifier,简称NPI)


在整个企业或医疗机构范围内由于缺少全局患者识别码造成实现企业主患者索引很大的困难。国家患者识别码(NationalPatientIdentifier)给每个患者一个永久分配、唯一的号码,用于整个国家医疗体系的各个系统中。有些国家如荷兰(Netherlands)、爱尔兰Ireland实现了国家患者识别码,每个患者永久唯一的号码,大大降低了企业主患者索引的部署和维护成本,提高了医疗运营的效率。也有些国家如美国一致困难重重推行国家患者识别码。有支持声,也有反对声。反对声主要是担心实现国家患者识别码的成本,现有的医疗系统都要升级支持国家患者识别码。创建和分配患者识别码可能会导致问题。如果错误地给两个病人相同的号码,可能会出现严重的医疗问题。如果医生输入错误的号码或在错误的号码上添加医疗记录,那么药物或测试将是不正确的,护理可能是致命的。美国国会去年指示国家卫生IT协调办公室(ONC)支持国家患者识别码的工作。总的来说,在没有实现国家患者识别码国家关于NPI问题一直在争论。但是,正确患者识别的重要性是显而易见的,正确实现国家患者识别码的益处也是不言而喻。


08

结语


企业主患者索引EMPI技术理论和产品的内容非常丰富,与主数据管理MDM技术、数据质量(DataQuality)和数据治理(DataGovernance)技术密切相关且不可分,这是医疗信息系统的基础之一,深入地阐述其相关的理论与应用实践需要大量篇幅。企业主患者索引基础理论和技术也趋稳定,但仍然在向更高水平、更深要求发展。业界也一值在讨论关于更精确的患者匹配、识别和应用。2019年9月,美国国家卫生信息技术协调员办公室(ONC)还举办了为期一天的患者匹配专题讨论会,研讨会聚集了各方面的专家包括一线的技术开发人员,讨论了患者匹配的挑战和支持数据互操作性的机会。本文只能根据多年的理论和应用实践概述一下各方面以提供一个参考,更深入更广泛的交流有机会以后继续,以益于同行们更高水平的理论与应用的创新。


主要参考文献




1.  Record LinkageDunn, Halbert L.  American Journal of Public HealthDec 1946 
2.  Automatic Linkage of Vital Records, Newcombe,H.B.,J.M.Kennedy,S.J.Axford; A. P. James, Science, Oct 1959
3.  A Theory for Record Linkage, Ivan P.Fellegi, Alan B. Sunter, Journal of the American Statistics Association, Volume 64, Issue 328, Dec 1969
4.  Advances in Record-Linkage Methodology as Applied to Matching the 1985 Census of Tampa, Florida Matthew A.Jao. Journal of the American Statistics Association, Volume 84, Issue 406, Jun 1989
5.  Approximate String Comparison and its Effect on an Advanced Record Linkage System, Edward H.Porter and William E. Winkler, US. Bureau of the Census, 1997
6.  Automated Spelling Correction, Statistics Canada, Budzinsky, C.D.1991
7.  Using the EM Algorithm for Weight Computation in the Fellegi-Sunter Model of Record Linkage, William E.Winkler, Proceedings, American Statistical Association, 19988
8.  Entity Resolution and Information Quality, John R.Talburt,Morgan Kaufmann,Dec 2010
9.  Oracle Healthcare Master Person Index
https://www.oracle.com/industries/healthcare/master-person-index.html
10. Gartner Master Data Management Review
https://www.gartner.com/reviews/market/master-data-management-solutions
11. Record Linkage
https://en.wikipedia.org/wiki/record_linkage
12. 《中国医院信息化发展研究报告白皮书》中国医院协会信息管理专业委员会、埃森哲咨询公司, 2008
13. 《中国医院信息化状况调查》中国医院协会信息管理专业委员会, 2019
14. 《医疗机构医疗大数据平台建设指南》中国医院协会信息管理专业委员会,2019


作者简介

叶常青

快阳科技(苏州)有限公司首席技术官

前美国甲骨文ORACLE全球医学科学事业部资深主任架构师

前美国健康信息交互(HIE)创新公司SANDLOTSOLUTIONS系统兼软件架构师

前美国医疗健康主数据开源产品iOpenMPDM作者




CHIMA大讲堂直播与回放:

https://djt.chima.org.cn

全国卫生健康行业网络安全技能大赛

https://chcsc.chima.org.cn