金域医学:医检大数据的治理和质量改进实践
本案例获得CHIMA 2020医院新兴技术创新应用典型案例“医院数据治理建设”方向三等奖。
广州金域医学基于数据中台的逐步建设,以实现国民健康大数据分析、医生精准诊疗、优质医检服务为目标,结合社会环境、内部业务发展、外部合作机会,推动医检大数据的应用和治理的不断优化,让金域深耕行业26年积累下来的数据发挥更大的价值,促进我国医学检验诊断事业的发展和进步。
(1)建立标准医检元数据管理体系。
(2)初步完成医检基础数据标准化(含疾病相关维度)。
(3)搭建数据资产管理平台。
(4)建立数据管理领导工作机制。
(5)面向实际医检应用场景,形成整体大数据服务方案支持。
医检大数据数据管理和应用的建设思路为:
建设数据后台:实现业务系统数据、专业系统数据、数字化资源的集中存储。
建设数据中台:作为各业务的数据源,为应用系统提供综合的数据和计算服务。
形成应用规范:以探索临床疾病大数据价值与应用为导向,推动服务完善与丰富,从而推动数据中台的建设实现数据服务化,再次推动数据后台的建设,在过程中逐步形成规范的数字资产管理和应用规范,最终发展数据治理在医疗健康领域的运用。
图1 医检大数据管理和应用建设思路
图2 金域大数据平台云架构
图3 金域医学数字化建设——中台数据驱动架构
金域医学目前已在内地及香港地区建立了37家省级中心医学实验室,拥有遍布全国的远程病理协作网,以及由600多名国内外病理医生加盟组成的病理医生团队,为超过22000家医疗机构提供准确、及时、便捷的医学检验及病理诊断服务。服务网络覆盖全国90%上人口所在区域,并以香港为桥头堡,服务粤港澳大湾区以及“一带一路”沿线国家和地区。通过对接国际和自主创新、成果转化等多种方式,金域医学可提供超过2700项检测项目。年检测标本量超7000万例,积累了全球领先的东方人种大样本、大数据库,并以此为基础推动体外诊断产业和人工智能诊断的原始创新。
医检大数据是金域的重要数字化资产,同时也是金域医学用切实行动助力健康中国梦,帮助医生看好病,提供优质医检服务的有力抓手。
医检大数据数据管理和应用建设,将主要沿以下技术路线进行建设:
(1)根据前期公司战略规划和IT规划,规划数据中台,逐步建设数据底座。
1)医检数据中心化。实现金域历史数据的集中存储,规划并逐步实施数字病理切片等非结构化数据的集中存储。
2)检验数据标准化。对异构的检验数据进行梳理,建设标准化的统一数据结构,并以此形成数据字典,其中具备受检者、临床信息、检验信息等关键字段。
(2)逐步推进数据治理工作,为检验生产运营提供数据服务支持。
1)将检测结果信息结构化,向内部用户提供查询与下载接口,向医院客户提供WEB自助查询服务。
2)对检测TAT时间实现标准化管理,以分析检测产品属性,服务生产运营。
3)按业务发展和科研的需要,聚焦特定疾病,结合临床专家意见,以疾病线为维度对数据进行清洗、标准化与结构化工作,并且推出对应的数据分析、知识管理等服务,反馈生产运营。
图4 金域医学健康大数据云平台
(1)建立标准医检元数据管理体系
对采集源端数据库信息和存储目标端数据库信息的元数据进行管理,制定标准元数据管理规范,使用大数据技术,对数据资源进行解析、清洗、转化、聚合、过滤、计算、整合管理;构建精准医学大型知识库元数据标准管理规范。建设过程中,逐步形成以下流程和管理规范:
《集团经营数据字典》:涉及集团经营数据的口径、来源、数据负责部门、统计周期。
《集团数据资产标准化定义及数据服务规范》:涉及数据规范、指标体系、数据服务定义。
《集团数据资产标准化建设规范》:涉及项目管理、数据验证、项目验收等。
《集团数据资产管理规范》:涉及安全、数据应用范围、保密等级等。
图5 数据字典
图6 元数据管理
(2)初步完成医检基础数据标准化(含疾病相关维度)
面向医检、临床疾病与运营基础数据标准化的目标,为数据资产管理建立一套数据标准和数据模型,实现病理数字切片与检测数据标准化,例如:
图7 产品结构标准化
图8 实验室检测项目标准化
(3)搭建数据资产管理平台
金域医检大数据平台已经集中26.2T结构化数据,57.82T的非结构化数据。涉及物流标本量1.24亿;报告单1.71亿;病人8234.5万;项目检测次数5.84亿;项目种类数:2709;申请单1.31亿;医院:4.33万;医生:153.73万。经过数据治理已经标准化120万的维生素D数据,13万的肾脏疾病数据。
金域医学通过建立数据字典、数据模型,对集团各业务系统的数据进行盘点与归类,并已搭建数据资产管理平台,为后续数据的资产化,资产的价值化提供有效的工具支撑。
图9 数据资产管理平台界面
(4)建立数据管理领导工作机制
1)建立数据领导小组:由CEO担任领导小组组长,领导小组成员为集团办公会成员。
主要职责包括数据和指标需求的决策、数据读取的授权范围和核准等。
2)建立数据工作小组:
① 梳理并提出医检业务主要数据指标的整体需求方案,包括明确数据的定义、计算口径,数据收集和录入的方式、提供数据的责任部门,形成统一的数据字典。
② 协调、统筹总部各部门、子公司,实施数据收集与录入。
③ 通过IT技术在数据资产管理平台中实现数据呈现,并推广、宣传、培训平台相关应用。
图10 数据工作职责结构
梳理完成新冠业务数据,为金域在全国‘一盘棋’集团化的抗疫作战模式提供数据支持。
新冠肺炎疫情期间,金域医学集团依托自身病毒检测能力和物流网络等专业优势,截至7月中旬,已在包括湖北、广东、北京、上海等全国29个省市区,以及香港特别行政区获授权,接受委托,陆续开展筛查、发热门诊、住院、院内感染、复工、复学及入境等相关人员的核酸检测和抗体检测。截至6月底,集团累计核酸检测总计超2500万,日检测产能达25万。为了让管理层全面了解疫情对业务的影响,项目对新冠检测底层业务数据进行梳理,分析,每日动态展示业务量和标本量,结合不含新冠的数据,以便及时掌握受新冠影响的情况,以及掌握正常业务恢复的情况。
图11 新冠业务数据分析展示
图12 新冠检测标本量查询SQL语句
中共中央国务院2020年3月30日发出的《关于构建更加完善的要素市场和配置体制机制的意见》,将数据治理与应用的提到了新的政策高度。金域医学将持续推进数据中台与数据治理同生共长,关注目前已在或者将在应用场景中使用的数据,并追溯到该数据所引用的源头数据开展治理,最大限度的优化数据治理的资源投入,提高数据治理的功效,通过数据需求、数据质量、元数据管理等领域加强数据治理。其具体举措包括:
(1)构建企业级数据模型,指引业务系统建设
在数据中台建设中,以数据应用为指导,梳理业务流程、业务数据,构建企业级数据模型,建立模型原则与规范,并应用到源头系统的设计与审核过程中,有效提升源头系统数据的统一性。
(2)增强业务需求管理,构建并持续完善数据标准体系
收集各层级管理人员和业务分析人员的业务需求,持续提炼数据中台业务需求,依据需求及管理办法,落地与集团数据标准体系相吻合的指标体系。
(3)提升元数据的数据质量,深化元数据分析及应用,实现数据资产化管理
通过数据中台建设流程,整理业务层面的数据资产目录,以及维护开发方面的物理数据模型和数据字典,实现数据资源的语义化,并通过识别和追踪数据在全生命周期的各个形态和变化,实现元数据的分析管理。
(4)将数据治理融入到数据中台开发团队中
在数据中台的整个过程开发和运营过程中,开发与运维部门应主动参与或者主导数据治理过程,积极建立数据质量管理机制,推动落实数据管理流程,辅助数据治理归口管理部门,发现与解决数据质量问题。
(5)构建闭环的数据问题反馈机制,持续监控数据问题
针对数据中台识别发现的数据问题,开发与运维部门应与源头系统的开发、变更及后续质量控制相统一和协调,让源头系统的业务和开发人员成为数据中台数据治理的支持者和操作者。
金域医学希望通过推进医检大数据及数据中台战略的落地,实现数据标准化、业务数据化、数据资产化、资产价值化,进而推动医检行业数字化转型。