石金龙:解放军总医院医学大数据平台建设与科研利用实践

作者:杨永燕 发布时间:2021-05-26
浏览次数:

有效利用大数据,为医疗服务赋能,是医院“十四五”规划的重要内容。医疗行业在日常的临床和管理中产生了大量数据,亟需加强统筹和分析挖掘,以充分发挥数据价值。第五届世界智能大会智能健康与医疗高峰论坛5月21日在天津召开,在智慧医院信息化建设研讨会上解放军总医院医学大数据研究中心副主任石金龙受邀发表了主题演讲,详细介绍了该院医学大数据平台的建设与科研利用实践。他强调:“医疗信息化发展需求,生老病死现象背后的生物物理机制规律探索是医学大数据研究及应用的问题‘源头’。医学大数据的研究成果将为医疗信息化提供新功能、为生物医学创新研究提供驱动力。”


以下内容根据石金龙主任演讲整理。


建设三大基础数据库,实现数据的汇聚整合



信息系统在智慧医院发展过程中发挥了非常重要的支撑作用,尤其是在多院区架构下的大型综合医院,信息化是一个非常重要的基础设施,为医院临床诊疗和运营提供技术保障。随着信息系统应用越来越广泛,院内累积了大量数据。


解放军总医院最近几年一直在探索医疗大数据的应用。结合医院信息化基础和创新发展需要,医院于2016年设立了医疗大数据中心,作为全院创新能力建设的公共基础平台。2017年,由解放军总医院牵头,联合国内17家优势单位,获批国家发展改革委医疗大数据应用技术国家工程实验室,成为国内医疗行业唯一的大数据国家工程实验室。2019年底,医疗大数据中心转隶到医学创新研究部,组建医学大数据研究中心。


医学大数据主要来源于医疗过程形成的多元数据,以及对人体系统宏微观多尺度测量数据。从数据特征和分析利用的角度来看,可以初步分为五部分:结构化数据,这部分数据技术指标一般可直接用于统计分析;非结构化数据,比较典型的是电子病历形成的数据,这部分数据一般是不可以直接利用的,需要做结构化处理;医学影像数据,这部分也是数据利用度非常高的;时间序列数据,包括心电图、脑电图等数据,这块数据目前利用并不多,但是价值非常大,能够提供动态、连续的人体监测,有助于对健康监测进行评估;生命组学数据,这部分数据对于理解疾病背后的规律和生命背后的本质非常重要。


从国家工程实验室定位来讲,希望面向整个行业,以应用需求为导向,开展医疗大数据的技术创新、标准创新、产品创新和应用创新,推动医疗大数据应用领域的技术进步和产业发展。


近几年,医院建设了专科专病数据库、医学影像库和电子病历文本库三大基础数据库,实现了对超过25年全部临床数据的汇聚整合,建立了临床基础数据资源池,实现了全院历史影像的在线访问,全院的文本数据整合入库,支持对其自由检索。这三个技术库的建设解决了数据可及性的问题,让各个数据能够看得到摸得着。原始数据没法利用,需要进行信息加工和处理,对数据进行分层分级利用、评估和控制。目前,医院以临床科研为目的,已建立了30多个专病数据库,包括心衰数据库、急救病例数据库、肺癌数据库等,为科室按病种特征整理数据提供支持工具。这在一定程度上解决了数据的可用性问题。在此基础上,通过整理发布专题数据集、组织多种主题的数据竞赛活动等,进一步扩大数据利用范围和多学科深度融合。


构建数据资源管理平台,多角度探索数据应用



为推动数据更好地应用,解放军总医院建立了数据资源管理平台,将数据纳入一个平台管理,共解决了以下两个问题:通过对存量数据的存储和再加工,形成数据的二次利用;基于数据资源池,对多种数据库进行授权使用,通过数据集等方式解决数据使用的问题。


在具体实践中,医院进行了以下探索:搭建分布式并行检索集群,面向临床提供医疗数据自由检索支撑。通过检索应用的方式,更好地启动可以利用的数据检索,通过类似于数据库的平台,提高了数据检索的性能;搭建高性能组学数据处理集群并部署专业生物信息处理软件,支撑对高密度多组学数据的快速处理分析;搭建深度学习集群,支撑面向医学影像等人工智能的深度学习等。为加强数据资源的管理,医院制定了系列化的内部管理制度和对外合作制度,保障数据安全,保证服务质量和效率,探索有效的数据利用路径和应用模式。


“十四五”时期,医疗大数据的发展方向主要体现在以下四个方面:技术平台创新,主要体现为在技术研发上,进一步补充完善医学大数据技术工具,形成包括医学数据整合、数据检索、专病数据库、患者随访、医学自然语言处理工具在内的体系化技术平台;数据资源创新,体现为扩大医疗数据共享联合体,做大做强多中心医学数据资源,探索数据合作共享机制;临床应用创新,主要是瞄准医学大数据和人工智能发展的前沿热点,着力推动大数据成果的转化应用;服务模式创新,主要是总结大数据开发利用实践经验,提出医院大数据平台建设指南,建立大数据中心规范化的服务流程与制度,构建数据的应用模式。


医学大数据是支撑临床基础创新研究的重要途径,作用发挥取决于其满足医疗行为优化需求的程度、融合临床基础医学多学科的深度,从基本数据服务,配合临床应用和科研需求;到有效科研支撑,将大数据融入智能医疗和医学研究的全过程;再到数据驱动创新,推动和引导医疗服务优化和应用研究开展,医学大数据利用有其自身发展规律和应用路径。通过医学数据资源的平台化管理、数据利用的工具化支撑,并围绕临床应用需求开展跨学科的深度数据研究,医学大数据价值将逐步彰显并有效发挥作用。


医学大数据的应用道阻且长,希望各位同道一起,探索可行的实施路径,推动医学大数据可持续发展。


(本文由CHIMA秘书处根据石金龙主任演讲内容整理)




more