谢颖夫:数字驱动下的人工智能在医疗行业的应用实践

发布时间:2019-08-27
浏览次数:

随着智慧医疗的快速发展,基于医疗行业数字化、智能化及资源整合的需求,人工智能等新兴科技在医疗行业的应用程度越来越高。在CHIMA 2019大会上,云南省第一人民医院信息中心主任谢颖夫以案例的形式,详细介绍了人工智能在医疗行业的应用。



以下内容根据谢颖夫主任演讲内容整理。


今天汇报的内容包括四个方面:一是大数据驱动的智慧医疗;二是智慧医疗的建设思路;三是案例介绍——研究应用的系统;四是可穿戴智能健康技术。


人工智能可用于计算机视觉、自然语言理解与交流、认知与推理、机器人学、博弈与伦理以及机器学习等领域。


介绍一个案例:一只乌鸦给我们的启示,乌鸦是完全可以自主的智能,可进行感知、认知、推理、学习和执行。乌鸦自己把一件事通过少量数据想清楚,没人教它。而乌鸦的头不到人脑的1%。人脑的功耗大约是10到20瓦,乌鸦只有0.1到0.2瓦,就能够实现这个功能。这给硬件芯片设计者提出了挑战和思路。视觉芯片VPU,应该比后来的GPU更超前。


乌鸦认知的过程就是任务塑造智能。同样是在概率统计的框架下,当前很多深度学习方法,属于一个被称作“大数据、小任务范式”,在这个阶段需要做很多大数据的工作。开展人工智能工作,如果基础数据没有做好是非常困难的。


一、大数据驱动的智慧医疗


先汇报第一部分:数据驱动的医疗人工智能。当前,医疗大数据迎来爆发式增长,医疗行业在智能产业中占比显著,达30%;医疗数据量每年以48%的速度在增长,是增速最快的行业之一,从2009年到2020年医疗数据增长将达44倍,预计到2020年,中国医疗大数据应用市场规模将达到80亿元。


医疗人工智能具有以下特征:数据体量巨大,2018年全国诊疗人次达到84.2亿,产生诊疗数据30000TB,每个CT图像含有150M数据,每个标准病理图片接近5GB;数据的增长和处理速度快,医疗大数据每年以>45%的速度增长,诊疗过程中的检查检验结果需第一时间呈现;数据的价值密度低、应用价值高,医学影像信息中几百兆数据量的有用信息可能仅有几个片段,比如:大量的传染病监测数据中敏感信息少;数据结构多样,包括结构化数据、非结构化数据和医疗影像数据。


二、智慧医疗的建设思路


众所周知,建立智慧医疗的目的之一是打通医患、医疗机构、医疗设备之间的关联,建立全民健康信息平台,利用人工智能技术,达到信息共享和充分利用的目的。


在政策层面,国务院印发了新一代人工智能发展规划,对此,云南省积极响应。作为全省八大重点产业之一的生物制药和大健康在政策引导下,做了很多实事,包括为基层提供一些辅助诊疗,如远程芯片、人工智能技术、肺结核筛查等。全省智慧医疗的建设目标是以“大数据”为驱动力,建设以“智慧医院”为主,“智慧服务”、“智慧管理”为辅的医疗平台,实现云南省可服务于边疆地区的一体化“智慧医疗”体系建设,使医疗资源最大化,推动这一目标的落地需要人工智能、物联网、云计算、边缘计算等核心技术提供支撑。


三、案例介绍——研究应用的系统


在开展案例方面,我们第一个做的是肺癌筛查+人工智能处理。2006年,神经网络领域专家GeoffreyHinton教授在《Science》杂志上发表论文,首次提出“深度信念网络”的概念,即深度学习。其实,深度学习是机器学习中的一个分支,它最重要的应用是神经网络。近年来,很多企业和创业公司也开始用深度学习进行医疗行业的应用,比如病理学、肿瘤学、医学影像学等。相对于医学影像数据的增加,当前放射科医生仍然非常缺乏,特别是边远山区的基层卫生院非常缺乏影像人才,因此人工智能的应用有比较光明的前途,甚至在某些点上用途非常大。人工智能的理论和技术发展在自然图像识别上已相对成熟,以深度学习为主的人工智能技术已在包括人脸识别、物体检测等领域开展。医学影像的数据特点非常适合人工智能来处理。


目前,肺结节具有发生率高、复查率高、对比复查要求高、阅读耗时、人工易疲劳等特点,各大医院在高负荷工作的情况下,个体诊断准确度参差不齐、漏诊率高。应用AI辅助检测可以帮助医生在数百张CT片中寻找肺结节,并进行标注、测量体积,判断结节的形态和性质,最后自动生成结构化报告,从而在1-2分钟内完成一个患者的诊断工作,大幅提升医生的工作效率。


我们还做了基于机器学习的心血管疾病的诊疗系统。它是以心血管病为例,在医生诊断的基础上用计算机模拟一遍诊疗过程。该系统的实施有四个部分:一是病症采集,对病人的门诊病例、医学影像、生理化验等数据的收集整合,并进行预处理;二是预后评估,根据病人的后期随访记录,对病人的康复情况进行合理评估;三是诊疗方案推荐,对诊断出相同疾病的病人数据进行聚类分析,将相同病疾病类型的病人划归到一个簇中,并且选择高置信度的诊疗方案推荐给患者和医生;四是病症诊断,针对不同类型的数据采用不同的诊断分类模型,并采用集成学习的方法对得到的多个诊断分类模型进行加权集成。


我们收集的患者数据不但是影像数据,还有电子病历数据。根据数据多样性、非平衡性、高噪声和复杂性等特征,采用随机森林作为分类方法,通过对多个训练子集进行训练,得到多个不同的分类模型。我院通过筛选电子病历中的各项数据,挑选可用的医疗数据,对所选择的特征进行特征聚类,计算每个类别的聚类中心,新的医疗数据则根据与聚类中心的距离归类,找到医嘱手术表中对应的患者的诊疗方案,根据预备的阀值筛选诊疗方案,其中推荐的手术可分别设置不同的阀值以便获得更适合患者的推荐诊疗方案。


利用心血管病人相关历史病程波形数据,结合非监督学习中聚类算法对相关病例进行聚类,并关联历史诊断病例信息,建立病情严重程度分级模型。得到病情分级类簇中心之后,运用K近邻算法将采集到病人的生理波形数据的“压缩特征”与其进行匹配,不仅可以对当前病人病情进行合理的分级及病程的大粒度监控,通过类簇中关联的历史诊断及康复记录,还将为医护人员对病人愈后康复几率的预判提供重要参考。


四、可穿戴智能健康技术


当前,可穿戴的智能健康技术的应用也越来越广泛。它是基于移动物联网的智慧医疗,通过连接大量移动可穿戴设备,对海量个人健康数据进行智能采集、融合、分析、管理和挖掘,并提供相应的个性化医疗健康服务。我们做了一套基于病人完整医疗信息的四维病人生理化平台,可以设计成病人终身的伴侣,随着传感器的增加,它可以利用定位技术采集病人的体位和活动信息,并支持连接市场上最新的可传感设备收集数据。


人工智能的未来方向在哪?无论是知识图谱还是当下的深度学习训练,大都是基于概率统计理论,这个核心没有变。我认为未来人工智能发展的方向是模糊逻辑,甚至是动态模糊逻辑,这是解决目前人工智能遇到瓶颈的技术之一。同时,人工智能的发展依然处于非常初级的阶段,现状是“没有人工,就没有智能”。


我们把人工智能看成一棵大树,有人说爬到大树上看月亮和站在地上看月亮,哪个更近,似乎没有区别。然而并不妨碍我们给这棵大树浇水施肥,让我们怀着一个共同的梦想,这棵树终有一天可以长到月亮上去。


现在的深度学习体系,如果某一个值微小的扰动,就会改变很大。解决之道就是模糊逻辑,或者是动态模糊逻辑,这块可能是未来发展的方向。