郑林:医疗数据统一归档应用的探索与实践
清华大学附属北京清华长庚医院(以下简称“清华长庚医院”)于2014年11月28日开业,是一所由清华大学与北京市共建共管的大型综合性公立医院,目前成立7大医疗部和50余个临床医技专科,总体规划1500张床,二期项目正在建设当中,预计2024年投入使用。“医院采取医疗与行政分工协同治理体制、整合式医疗模式、Attending医师负责制、全责护理模式,建立了全流程、全覆盖的医疗信息系统。”清华长庚医院信息管理部临床医疗组组长郑林谈到,医院信息系统以自研为主,全面支撑临床和管理对信息化提出的需求。
划分数据类型
为满足临床业务需求,增强HIS的稳定性,提高HIS的响应速度,清华长庚医院开启了临床数据归档工作。
郑林介绍,清华长庚医院的临床数据归档一开始制定了如下目标:建立统一平台(CDR),为临床提供一套统一的查阅病历的数据平台;以患者为索引的数据组织方式,以“患者为中心”来组织构建临床数据结构,方便临床查询及追踪患者疾病信息;保障HIS稳定与高响应,将CDR作为临床数据长期留存的场所,减轻业务系统的数据负荷,提升稳定性及响应性;便于管理,通过统一口径管理进出平台的数据,使实际操作更便捷,管理上更有效。
清华长庚医院为临床数据归档设置了整个架构,分为三部分:一是数据归档,二是权限管理,三是界面展示。
郑林介绍,数据归档是CDR归档过程中最核心的功能,主要作用是将临床数据从临床业务系统中经过数据治理,把数据插入到CDR数据库中,整个过程中分为三部分进行:第一部分,确定数据类型和业务范围;第二部分,对获取数据进行数据治理;第三部分,将数据治理的数据插入到CDR数据库中。
在进行数据归档前,郑林和同事首先要确定临床数据的类型,经过梳理医院数据库,按照数据的存储方式分为两类:数据库和文件类型。其中,数据库有两类:结构化数据,主要是生命体征、医嘱、处方、检验结果、部分检查结果等;非结构化数据,此部分主要是医护在诊疗过程中,手动录入的数据,如护理记录、检查报告等。文件有三类:XML文件,以电子病历为主的病历文书、会诊、各类评估表单、患者签署的知情同意书等;PDF文件,设备直出的报告、第三方系统表单,如麻醉记录单等;医疗图像,包括放射科影像、PACS、内窥镜、病理图片等图像资料。
采取不同归档策略
“针对不同的数据类型,我们采取的数据归档策略是不一样的。”郑林谈到。
其中,数据库中的医嘱、检查检验报告、处方等各类数据全部归档到CDR数据库中。“我们归档的所有数据,都是正式数据,即医生已填完和写完的电子病历。医生写病历过程中未审核的检查检验报告,则未被归档。”郑林介绍,将所有数据存到CDR数据库中后,对CDR存储过程分了三部分:最上面是患者索引,主要是将患者的唯一标识做了标记,同时将患者标识与其他数据进行关联;中间是数据分类,主要指患者在一次就诊过程中产生的很多数据,比如医嘱、文件、检查检验报告等,在进行存储前先把这部分数据进行分类,方便把它们插入不同数据库表中;底下是数据存储,采用了Oracle和MongoDB两个数据库。
对于文件,郑林和同事分别进行了归档:XML文件,病历文书、会诊、各类评估表单、患者签署的知情同意书等病历文书,以文件的路径进行数据归档;PDF文件,上传到文件服务器,同时归档文档路径;医疗图像,以界面集成的方式实现归档,直接调用第三方的展示应用。
“在我们进行数据归档过程中,整个设计的关键点体现在以下四个方面:患者的EMPI,保证患者的唯一索引,我院是采用了GUID作为患者唯一标识;患者关联,存在同一个GUID下,有多个患者ID的情况,因此必须要有对照关系;按存储方式区分,根据医疗数据的存储形式,对医疗数据进行分类,以便进行数据存储;分类存储,将每一条数据赋值唯一ID,并进行分类存储。”郑林介绍,清华长庚医院的数据归档实现了对获取的临床业务数据进行治理,并按照数据格式,插入到CDR数据库中,同时结合医院实际情况,自定义数据格式。
郑林和同事在进行数据归档时,采取了以下业务逻辑:第一,获取数据,整理数据;第二,判断是否存在患者唯一索引,若为新患者,则新增归档数据;第三,判断项目是否存在;第四,判断数据是否为最新,如果新数据大于等于旧数据,则代表有更新,如果新数据小于旧数据,则代表有作废。
对于异常数据,郑林及同事采取了以下处理措施:按就诊重新归档,未能充分核实,造成就诊人错误,例如医保信息,对业务数据进行重新调整后全部归档;某条记录进行了修改,例如长期药嘱的,为避免纠纷,提出修改后台数据;归档系统异常,在归档过程中HIS宕机或归档数据宕机,则可重启;实时追踪,将归档日志以短信及邮箱形式发送给DBA。
据了解,清华长庚医院此次将2014年11月28日至2023年5月20日大概9.5年的数据进行了归档,范围包含就诊、病历、医嘱、检查、护理、麻醉记录单、特护单、治疗记录等9大类。归档的就诊次数为772万,注册业务数据条数为5050万。
在谈及近期对于数据归档的规划时,郑林介绍:“我们主要进行两方面的工作:一是优化展示形式,实现网页版及移动端的CDR总览,以便临床可在外地进行患者数据查看;二是区域数据归档,进一步实现医联体内数据的共享与归档,实现区域内CDR的总览功能。”
下一篇: 2023年医信政策、行业、个人回顾