广州中医药大学第一附属医院:中医药临床科研一体化大数据平台
本案例获得CHIMA 2020医院新兴技术创新应用典型案例“医院数据治理建设”方向二等奖。
广州中医药大学第一附属医院信息化建设经过多年的探索与实践,特别是“十二五”期间的不断完善和多次升级,按照《中医医院信息化建设基本规范》,确立了“以病人为中心、以临床为核心、以科研为抓手、以区域为导向,建设有中医特色的数字化医院”的核心建设思想,并取得了一系列显著的建设成果:2012年建成国内第一个中医医院智能化运营平台,获得“省级基于电子病历的医院信息平台试点单位”、“广东省智慧医院建设单位”等称号,成为广州首家使用微信预约挂号及缴费的三甲中医院,荣获2013-2014年度十大优秀移动医疗项目奖,于2019年牵头制定“医疗数据中心建设规范--科研数据中心”的团体标准,并于2020年8月17日由广州市标准化促进会正式发布。医院完善的信息技术基础为信息化深层次发展提供了有利条件。
医院作为国家中医临床研究基地和岭南医学研究中心,除了承担日常临床工作之外,各学科还承担着越来越多的国家、省部级研究课题以及企业横向研究任务。在愈发强调疾病诊疗个体化和追求诊疗效费比的今天,依托医院大量临床病例开展真实世界研究成为现代医学研究领域的热点。广州中医药大学一附院作为优势学科聚集的研究型医疗机构,各科专家都迫切希望能够即时获得临床数据用于支持其临床研究工作,传统基于手工誊抄病案的研究数据获取方式因为存在重复劳动、效率低下,质量难以控制,研究周期漫长等诸多问题而难以为继。
2019年10月10日,广东省健康医疗大数据标准工作组科研数据中心标准小组启动会顺利召开。该标准由广州中医药大学第一附属医院牵头,联合中山大学附属第一医院、广州医科大学附属第一医院等十家医院共同参与编制。经过近一年的初稿编撰、意见征求、终稿修改、专家审定、公告发布等工作,《医疗数据中心建设规范第3部分科研数据中心》团体标准于2020年8月17日在“全国团体标准信息平台”正式发布,并于2020年9月1日开始实施。
我院参照该团体标准,启动中医临床科研一体化大数据平台建设,通过科研数据中心汇聚医院多源异构的医疗数据,利用先进的计算机技术对数据进行治理,实现数据的标准化和统一化,并在数据挖掘分析的基础上更好地支持回顾性和前瞻性研究项目的开展,为我院临床科研工作保驾护航。
医院于2020年正式启动了中医药临床科研一体化大数据平台建设项目,确定以肺癌、心衰、复发性流产、糖尿病、针灸中风、慢性鼻窦炎、COPD、慢性浅表性胃炎、股骨头坏死、慢性肾衰竭等10个专科病种为切入点,搭建院级数据元管理、临床研究管理、影像集成、随访管理、数据脱敏、基于AI的科研大数据管理中台、一站式科研数据挖掘等应用系统,开展专病临床数据标准化,电子病历临床科研一体化改造、医院临床数据整合与治理等系列工作,建立横纵双向打通医院临床与科研瓶颈的一体化工作平台,为医院开展前瞻性研究和回顾性研究提供高效支撑。
(1)加强中医专科专病数据标准化建设
搭建标准化的中医术语库,针对肺癌、心衰、复发性流产、糖尿病、针灸中风、慢性鼻窦炎、COPD、慢性浅表性胃炎、股骨头坏死、慢性肾衰竭10个病种的专病数据进行标准化处理,实现各专科病种的专有标准数据集,满足临床科研、临床诊疗、医院管理、医疗控费等业务的数据共享支撑。
图1 遵循ISO1179元数据标准对专病数据进行标准化
(2)改造临床科研一体化EMR模板
通过与各专科沟通、分析、总结,对现有EMR模版进行临床科研一体化改造,实现10个专科病种数据从源头实现临床与科研数据的统一采集,以EMR改造为抓手,提升科研效率。
图2 改造后的临床科研一体化电子病历模板
(3)高效再利用影像数据
无缝对接院内PACS系统,提供影像数据整合、后处理、影像协作、传输、管理、快速调阅等功能,实现影像数据在多终端的高效共享与再利用。
(4)加强保护患者隐私数据
存储在科研数据中心内的所有受试者隐私数据均需通过数据脱敏系统进行漂白脱敏,并且确保科研数据脱敏后不失真,提供优质的脱敏数据,以供科研业务使用,充分防范临床科研中发生数据泄露。
(5)建立数据驱动型的大数据科研分析平台
通过数据的清洗、归一、整合处理,将数据统一汇聚在科研大数据分析平台中,形成中医特色的专病知识图谱,实现智能化的研究人群筛选,扩展了人群分析、研究建模、数据导出、数据质控以及患者个案视图等六大核心应用;能够提供更加灵活、便利的数据查询、数据挖掘能力,更好地更快的进行研究成果挖掘。
图3 数据清洗后的归一整合
图4 疾病知识图谱
参考原国家卫生部数据元标准WST 303-306规定的卫生信息数据元模型、属性、卫生信息数据元的命名、定义、分类以及卫生信息数据元内容标准编写格式规范;遵循国际公认的数据元标准规范ISO11179对数据项进行标准化处理。
数据抽取主要使用ETL进行数据清洗,ETL从数据源抽取出所需的数据,并进行数据清洗转换,最终按照预先定义好的数据仓库模型,将数据对应地加载到数据库中。数据脱敏是根据HIPAA的法规制定需要脱敏规则以及脱敏方法。
遵循GCP管理规范,随访模型 “CDISC”标准,满足研究人员自定义研究方案,如队列研究、药物临床试验等。支持多项目、多中心平台化管理,可进行互联网化部署。
图5 基于CDISC标准的方案配置
利用大数据技术,主要为N-最短路径、HMM、由字构词的汉语分词方法以及基于词表的分词等,基于现存的标准词库,如ICD-10、ICD-9、SNOMED CT、LOINC等。结合人工加机器的方法,不断将临床医学词汇进行正确的归类,逐步实现知识语料库的建立。自然语言处理技术可以在文本信息和结构化信息间架起一座桥梁,它可以在不影响人类以自然语言交流、记录信息的习惯前提下,将自然语言转化成结构化语言,方便计算机进行自动的信息处理。
基于R语言技术,大数据科研分析系统提供20余种医学上常用的统计模型,包括比较均值分析、非参检验、回归分析、相关性分析和生存分析等,也包括大数据挖掘处理算法,如主成分分析、决策树等。临床医生可根据具体业务应用场景灵活选择,或自由组合查询;并基于人群扩展了六大应用,包括人群分析、研究建模、数据导出、数据质控、数据挖掘以及患者个案视图等。
图6 集成R语言的统计模型
中医药临床科研一体化大数据平台的建设,对我院“医、教、研”综合实力的发展将启到大力推动作用:
建立以患者整体画像与诊断结果之间的关系为核心的中医诊断关系脉络图谱,反向应用于中医临床诊断过程当中,帮助医生更全面的分析患者病情,得出结果与医生经验相互佐证,提升临床诊断水平,推动中医诊断体系的标准化。
结合文献古籍与患者的“表征→诊断→治疗→预后”全流程数据,探索验证中医药疗法与疾病转归之间的关联规律,有助于选方择药治疗疾病。同时结合现代化西医技术,与传统古方互相验证,发掘符合当代实际的治疗方案,去伪存真,更好地推动中医药疗法的发展。
基于中医体质辨识理论体系的内容,对患者画像数据进行客观分析,能得到较为客观的患者体质分型,再结合大数据分析给出的行为、表征、患病、转归的各个环节发展路径预测,进行全方位、多途径、多环节的“精准调理”,阻断健康向亚健康发展、亚健康向疾病发展,真实有效的维持健康状态,提升生活质量,实现超前的治未病的疾病防控目标。
平台中积攒大量病例数据,建立经典案例库,寓教于研,将临床实践与研究方法、成果同时应用于中医临床教学,既能更好地传承中医精粹,又能推广中医研究思路及方法,促进中医理论体系的长足发展,大幅度提升教育水平,打造符合时代特点的中医传承模式。
从宏观视野分析当下常见病、多发病的复杂病因,找出背后潜在的共同病因及关联性,动态把握中医疾病的发展规律。采用数据挖掘方法和复杂网络分析方法,从中医药大数据中发现疾病证、治、法的特定规律,为中医治疗水平的提升提供更多的可能性。
建立中医大数据知识图谱,支持患者智能预问诊、智能分诊等自动化服务,简化患者就医流程,降低临床医生重复工作。同时通过对中医药大数据的深度挖掘分析,总结出不同类型人群的疾病发展路径,发现病程各节点的疾病变化规律,分析出特定人群中医康复治疗的有效特点,最终形成个性化中医健康管理方案,促使中医药手段在健康管理中发挥更大的支持作用,打造“数据多跑路,患者少出门”的中医诊疗服务新体验。
我院通过中医临床科研一体化大数据平台建设,利用医院现有临床信息化优势,运用大数据及AI等先进技术,遵循《医疗数据中心建设规范-第3部分-科研数据中心》的团体标准的要求,结合中医药的特色,坚持贯彻我院“科技兴院”的理念,提高医学科研成果转化能力,让科研更好地服务于临床,服务于患者,为建设国内一流、国际知名、具有鲜明岭南中医药特色的大型现代化中医医院而不懈努力。