黄基:全院一库内存数据库与AI驱动的NLP技术应用

发布时间:2025-04-23
浏览次数:

  创办于1937年的福州大学附属省立医院(以下简称“福建省立医院”)是一所集医疗、教学、科研、预防和保健为一体的三级甲等综合医院,开启了“一院两区”新发展格局。在医院发展过程中,信息化发挥了非常重要的支撑作用,由此积累了大量数据。“医院通过数据汇聚与统一治理,提升医疗服务质量。”福建省立医院信息管理中心高级工程师、福建省医疗大数据工程重点实验室副主任黄基介绍。

  在黄基看来,医院数据应用主要面临以下挑战:找数据难,数据分散在众多业务库中,各库表结构不一,目标数据难以定位;管不着、管不好数据,数据分散即为管理人员的管理时间和精力的分散,难以同时在理解几十上百个业务库数据的情况下还能及时进行有效的数据管理;用数据难、复用数据更难,业务库在支撑业务系统正常运行的情况下再支撑数据服务要求,算力不足,面向不同角色/不同次数的数据需求,往往需要0-1的开发;看不见、看不懂数据,专业表数据需专业人士解读,全面的数据可视化展示工具,很多决策者的“金点子”就此夭折。“简言之,医院数据应用主要存在多库、异构的结构性制约。”他总结。

  为了打破数据存、管、用的制约,福建省立医院改变了过去全院多库的状态,构建了全院一库,实现了全院级全量数据汇聚、调取和使用,且具备高算力。

开展医疗数据标准化治理

  福建省立医院数据库实现全院一库后,将数据汇聚到一起,主要开展了以下应用:数据集成,融合多源异构数据,稽查数据质量;数据治理,对文本进行结构化处理,并对数据进行标准化处理;数据应用,实现数据的检索、导出,满足科研、医疗质控等多样化应用。

  “我们对数据开展标准化过程中,与标准的数据集进行映射。同时用NLP的技术实现了非结构化数据的结构化。”黄基介绍,医院引入了质控平台,每个过程基于数据的及时性、一致性、完整性等,形成了统一的报表,向各个职能部门推送,保证了数据的稳定性。

  在全院一库的基础上,福建省立医院建设了全院科研大数据平台,为院内用户提供数据支持,在平台上可进行统一的科研探索和复核检索,科研数据年服务200多次。同时,医院的数据实现了申请、接收、审批、解读、分析、分配、脚本、运行、存档、推送的完整闭环管理服务。

AI赋能数据分析和安全

  为了更好地推动大数据为科研服务,福建省立医院将AI应用于数据分析中。“因为Meta LLaMA 3已具备文本分析的能力,因此可以借助它为科研提供服务。”黄基强调,基于这个考虑,医院推动了AI模型的本地化,通过云计算和开源服务等成熟的平台,实现数据的高度集成,可进行低门槛数据清洗、高效的统计分析,在确保数据安全的同时,更好地提供自助科研服务。

  大数据汇聚到一起后,数据安全的重要性更为凸显。“我们将Meta LLaMA 3应用到数据分析中,虽然提高了分析的效率,仍存在安全隐患。为降低数据泄露风险,医院采取本地化AI部署,并构建高级沙箱模型,以强化数据安全。”黄基谈到,医院也将一些国内的大模型适配到数据分析中,通过大语言模型赋能临床和科研,加速医务人员文本输入的过程。

  黄基认为,目前临床业务普遍存在以下挑战:临床、科研交叉,病历工作量大;表单数据收集难,而且缺少结构化;数据质量要求高,多人核对;回顾性数据代码量巨大,获取数据技术门槛高。

  为应对这些挑战,福建省立医院推出了结构化病历,拥有结构化模板设置界面、结构化病历使用界面以及结构化病历后台存储,由此拥有了明确的数据结构,便于快速查找关键信息,提高标准化和可比性。

  “在借助信息技术助力临床和科研的过程中,没有单一的技术是完美的。医院信息化建设的核心在于以需求驱动技术选型,结合成熟与前沿技术,打造最适合临床和科研的数字化生态。同时,还要将成熟技术和前沿技术糅合到一起,取长补短,以有效避免技术缺陷,使信息技术发挥最大的效用。”黄基总结道。