浙江金华广福肿瘤医院:融合深度学习和知识图谱的病案自动编码及DRG运行分析系统研究
2023年医院新兴技术创新应用典型案例征集活动经行业专家背靠背盲审以及终审,共选出24篇典型案例,将陆续刊登,以飨读者。
1 项目简介
随着DRG/DIP改革加速推进,医保对医院的运行管理提出了更高要求,如何提升病案首页质量?如何解决病案编码人员短缺和专业度不足导致的编码质量良莠不齐和效率低下问题?如何通过提高DRG/DIP入组和支付预测准确性来加强医院运营管理水平?已成为各家医院亟需解决的问题。
我们通过对病案自动编码及DRG运行分析方法的研究,发掘融合深度学习和知识图谱的人工智能技术在其中的应用,并对智能系统应用前后的重点监测指标进行对比分析,如医生编码错误、病案首页质控评分、DRG入组率、DRG医保结算率、超支结余情况及人员成本等,结果表明智能病案机器人系统在提供即时编码建议、DRG入组分析和动态支付预测方面具有相当高的准确性(均>95%),对提升医疗质量和精细化运营管理水平具有重要价值。
2 建设与开发
(1)系统规划、开发和部署
系统整体架构设计为四层:数据层、平台层、应用层和用户层;病案自动编码通过电子病历信息抽取模型+文本多标签分类模型+核心词匹配模型的混合模型实现,通过搭建QUERYX数据库安全管控平台和数据脱敏等安全产品保证系统安全性;基于BERT+BiLSTM模型构建区域自适应DRG预入组器及付费模拟器;同时基于大数据聚类技术构建费用预警模型。
(2)模型训练
获取2021年1月至12月病历数据、上报医保数据以及医保反馈数据进行数据清洗确保数据质量,组织标注人员对清洗后的病历数据进行标注,对标注后的病历数据和医保数据设置训练集、测试集、验证集进行模型训练。
(3)模型校准
为避免模型输出错误编码,错误预入组结果、错误费用预警提示,利用核心词匹配模型和医保反馈数据再次对编码、预入组和费用预警结果进行确认。
(4)效果评价
1)病案自动编码模型准确率评价:将2022年2月完整病历数据作为测试集,将自动编码结果与医院上报医保数据进行比对,从而对病案自动编码准确率进行评价。
2)智能DRG预入组器准确率评价:将2022年2月上报医保数据作为测试集,将预入组结果与该月医保反馈数据进行比对,从而对智能DRG预入组准确率进行评价。
3)费用预警模型准确率评价:将2022年2月上报医保数据作为测试集,将费用预警结果与该月医保反馈数据进行比对,从而对费用预警准确率进行评价。
3 产品描述及关键技术
本产品高度模拟病案专业人员解读病历并运用病案专业知识完成病案管理工作的行为,从电子病历文本中识别病理、病因、解剖部位、临床表现、检验检查等疾病诊断相关特征,以及手术操作、药品、耗材等疾病治疗相关特征,同时结合病案管理专业要求,在保证病案首页信息与电子病历信息一致的基础上高效实现病案自动编码(病案自动编码准确率高达95%+,一分钟完成10份病案编码)。
基于国家医保局发布的CHS-DRG分组方案,充分结合本地历史医保反馈入组数据,通过大数据处理技术,构建了高度拟合区域自适应的预入组器(拟合率高达98%),并将该功能前置到患者在院过程管理中,把控数据源头,精准定位风险对象和重点问题,实时预警超支风险。同时深度挖掘历史数据潜在价值,深入分析及监测DRG运营管理全场景,实现全院/科室/诊疗组/医生/病组/病例层层下钻,有效帮助医院开展适应本地化特点的DRG医保支付运营精细化管理。本产品关键技术如下:
(1)电子病历信息抽取模型
原始BERT+BiLSTM+CRF由具有上下文特征抽取能力的BERT、特征再抽象加工BiLSTM(双向长短记忆网络)和CRF(随机条件场)判别最优信息标签序列组成,最终实现抽取文本实体名称、类型及其位置的功能。
(2)文本多标签分类模型
将电子病历中BERT+BiLSTM+CRF模型识别出的临床诊断进行多标签分类编码(见图2),使用BERT+BiLSTM用于上下文信息的特征提取汇总,后接一个全连接层输出Y=1XN大小的标签概率向量。
(3)核心词匹配模型
临床诊断经过多标签分类编码模型可获得编码结果,但有时也存在错误。鉴于此,引入基于知识图谱的核心词匹配模型过滤错误编码。对编码使用知识图谱判别其临床诊断中是否有提及相关ICD卷三核心主导词路径集合,若存在则核心词匹配成功保留该标准编码,反之则匹配不成功删除。
(4)区域自适应DRG预入组器及付费模拟器
基于国家医保局发布的CHS-DRG分组方案,充分结合本地历史医保反馈数据,生成地区特有的ADRG入组数据,利用大数据处理技术,构建并训练基于BERT+BiLSTM模型的DRG预入组器。同时结合付费管理政策,解析与反算重要付费参数并构建付费模拟器。
(5)费用预警模型的构建
使用大数据聚类技术,对历史上报及反馈病组数据进行合理聚类,设置关键指标筛选具有病组标杆性质的优良病例数据,构建标杆病组费用普遍发生曲线和费用预警模型。
(6)DRG运行分析模型的构建
4 产品功能展示
(1)自动生成编码
1)识别并提取出院记录中的关键诊疗数据
2)系统自动生成准确编码
(2)智能核查医生漏编
以手术操作为例,智能读取电子病历中关于手术及操作的相关信息,完整提取手术及操作名称,并自动生成正确的ICD编码,规避医生漏编手术及操作的情况。
(3)智能提示病历内涵缺陷
基于准确编码、合理入组的目标,智能识别医生书写电子病历中的内涵质量缺陷,智能提示医生完善相关电子病历书写,确保电子病历与病案首页数据一致。
1)遗漏诊断提示
2)手术及操作记录缺失提示
(4)DRG预入组分析
1)未按规则编码,未入手术组
2)医生编码入组情况
3)自动编码入组情况
(5)智能DRG支付额测算及超支结余测算
(6)智能科室/医疗组/医生DRG运营数据分析
(7)智能病组DRG运营数据分析
(8)智能费用结构分析
(9)运营指标分析
5 应用效果
(1)提升医生病案编码质量
(2)优化病案首页质控评分
(3)提升DRG入组率
(4)提高DRG医保结算率
(5)大幅改善超支结余情况
(6)降低人员成本
利用系统开展病案编码工作,可帮助医院节约53%的编码工作人力成本,计57万元/年。
6 总结
将人工智能技术与病案编码以及DRG运行分析系统有效结合,较传统工作方式,不但能够优化工作流程,避免因人为因素导致的错误,提升病案编码效率及质量,提高DRG入组质量,还可以对全院DRG运营情况进行多维监测,实现全流程数据管理,关注超支结余情况,锚定超支严重的科室/病组/医疗组/医生/病例进行重点分析。同时,还可以监测异常值和数据变化趋势,分析数据异常原因,针对性解决实际难点,实现DRG精细化管理,帮助医院应对医改带来的冲击,以智能化手段增强监测分析能力,提高资源利用率,实现提质降本增效,为医院高效科学运营提供重要的数字化支撑,真正做到精准赋能医院精细化管理,推动可持续高质量发展目标落地。
申报单位:
浙江金华广福肿瘤医院
联合申报单位一:
麦博(上海)健康科技有限公司、杭州医学院信息工程学院
技术方向:
大数据、医学人工智能
业务领域:
医院管理
下一篇: 天津市第一中心医院:智慧后勤管理平台