17.四川大学华西二院:大数据及人工智能方法在妊娠期糖尿病预测的应用【CHIMA 2019案例分享】
案例提供:四川大学华西第二医院
病案概要
现今全面二孩政策的放开,35岁以上的高龄孕妇将逐年增多,患上妊娠糖尿病的风险系数也进一步加大。近几年孕妇体检数据来看,患有妊娠期糖尿病的人数越来越多,不少学者已对妊娠期糖尿病的诱发因素进行了研究,但这些研究方法基本局限于经典统计范畴,主要基于两组病例进行对照统计分析研究,还无法对妊娠期糖尿病进行有效的预测分析。此外,妊娠期糖尿病筛查时间为妊娠 24~28周,该筛查方案难以满足早期预测及干预的需求。因此,本次研究采用现代人工智能方法,在妊娠早期有效预测患者妊娠期糖尿病的发病概率,为早期提出干预措施提供了相应的参考依据。
服务对象
本案例的核心是利用数据推动医院对yu孕妇妊娠期糖尿病提前预测,并制定针对性的策略,减少孕妇发生妊娠期糖尿病。服务对象包括:面向孕妇。
解决问题
运用大数据分析技术,在前期找到孕妇患妊娠期糖尿病高危人群,并根据孕妇的检测指标经过规范化的医学营养治疗和运动干预,大部分的血糖是可以达标的。
特色及亮点
1.首次采用孕妇建卡数据进行妊娠期糖尿病预测,具体操作如下:
以本院2013~2016年建卡并定期产前检查的孕妇资料为分析样本,选用孕妇在妊娠第12周的检查数据进行建模分析。采用末次月经时间在2013年10月1日到2016年1月31日的妊娠期糖尿病患者和非妊娠期糖尿病孕妇为建模训练数据,共计5834 人,确诊妊娠期糖尿病患者798人。选用末次月经时间在2016年2月1日到2016年5月19日的妊娠期糖尿病患者和非妊娠期糖尿病孕妇进行跨期检验,共计706人,其中确诊妊娠期糖尿病患者117人。以怀孕24~28周是否确诊糖尿病为预测目标,如确诊糖尿病则标注为1,正常则标注为0。采集孕妇诊断数据和化验指标进行预测分析并找到高度相关指标。
2.找到影响妊娠期糖尿病发病的相关因素,具体解释如下:
利用多种机器学习算法建模对孕妇在第12周检查的生化指标以及孕妇建档数据进行分析,比较发现TreeNet算法预测效果最佳。通过TreeNet算法发现孕妇的空腹血糖、分娩年龄、孕12周的前白蛋白水平、孕12周的体质指数等指标与妊娠期患糖尿病高度相关,整体跨期验证确诊率达64%以上。并使用 CART 算法找到了一组患妊娠期糖尿病高风险人群的规则特征。通过模型发现37个与妊娠期糖尿病相关的指标,其中4个孕妇早期指标空腹血糖、分娩年龄、前白蛋白、体质指数与妊娠期糖尿病高度相关;发现的分娩年龄和体质指数与妊娠期糖尿病风险相关的规律与临床经验一致;发现的生化指标前白蛋白在 GDM 的临床上一直未被关注,但最新的研究发现前白蛋白与糖尿病有某种关联性。
成果成效
本项研究是首次基于大数据及人工智能方法建立妊娠期糖尿病预测模型,找到易发妊娠期糖尿病孕妇群体,并针对易发孕妇进行提前干预,根据患者的实际情况制定预防措施,减少妊娠期糖尿病发生概率,达到早期预防目的,减少妊娠期糖尿病患病率。
下一步计划
目前进行完毕跨期验证,结果显示整体准确率达到64%,下一步进行临床随机试验,将孕妇随机分成两部分,一部分不做任何干预;另一组运用模型进行筛选高危孕妇,并对患病高危孕妇进行干预,后期在进行查看干预组与非干预组患病情况对比。