CPU也能加速AI?看汇医慧影医学影像系统的实战收获

作者:英特尔 发布时间:2021-09-16
浏览次数:




利用AI技术加快医学影像分析速度,支持医疗机构完成从信息化向智能化的转型,让更多病患从智慧医疗技术的发展中获益,是汇医慧影一直以来的目标和愿景。通过引入第二代英特尔®至强®可扩展处理器、OpenVINO™工具套件以及面向英特尔®架构优化的Python等领先软硬件产品和技术,使我们医学影像解决方案的各个平台的处理效率都获得了显著提升。——汇医慧影CEO&创始人 柴象飞




导语

尽管有多种多样的检测方式,但CT影像依然是新冠检测中更有效的判断依据。为了助力更加快速和精准地处理海量的影像数据,汇医慧影在英特尔软硬件组合拳的帮助下,全面提升其全周期AI医学影像解决方案的性能,在新型冠状病毒肺炎筛查、乳腺癌检测等多场景应用中都成效显著。



从2019年年底开始迅速扩散的新型冠状病毒肺炎(COVID-19,以下简称“新冠肺炎”)疫情,对医疗机构的快速诊断能力提出了突如其来且非常严峻的挑战,利用人工智能(ArtificialIntelligence,以下简称AI)方法开展医学影像智能分析及辅助诊断,是应对这一挑战的有效方案。一直致力于计算机视觉和深度学习技术应用开发的汇医慧影,就通过其自主研发的Dr.TuringAI平台、Radcloud大数据智能分析云平台以及Novacloud智慧影像云等产品,为众多医疗机构提供了一套全周期、高性能的AI医学影像解决方案,并将其成功应用于包括新冠肺炎在内的数十种疾病的诊疗。


作为该方案中专攻医学影像辅助诊断的前端先锋,Dr.TuringAI平台可为医院和患者提供10余种常见疾病的医学影像AI分析能力,并提供结构化的报告;Novacloud智慧影像云可通过基于云服务的端到端AI互动能力,为医、患和医院的管理者提供更为便捷的服务;Radcloud大数据智能分析云平台作为医疗机构推进科研的重要助手,则能提供多样化的影像大数据科学分析能力,可大大加快放射组学等新技术在医疗行业的研发与落地进程。


为帮助汇医慧影优化这一全周期AI医学影像解决方案的性能,英特尔不仅提供了集成有英特尔®深度学习加速(英特尔®DLBoost)技术的第二代英特尔®至强®可扩展处理器,用作方案的核心计算引擎,还提供了OpenVINO™工具套件以及面向英特尔®架构优化的Python等软件优化工具。得益于这些软硬件相互搭配、协作优化带来的整体加速优势,汇医慧影Dr.TuringAI平台在新冠肺炎筛查、乳腺癌检测等影像分析场景中的推理速度获得了显著提升。同时,放射组学分析方案在优化后的Radcloud大数据智能分析云平台的支持下,在处理效率上也收获了明显的加速效果。



汇医慧影全周期AI医学影像解决方案实现的应用优势:


•在与新冠肺炎筛查相关的肺部CT影像分析场景中,第二代英特尔®至强®可扩展处理器带来的算力与OpenVINO™工具套件带来的优化相配合,可令Dr.TuringAI平台的平均推理耗时缩短至原先的35%;


•在乳腺癌影像分析场景中,基于第二代英特尔®至强®可扩展处理器,及其集成的英特尔®深度学习加速技术提供的INT8推理加速,在Dr.TuringAI平台上构建的检测模型在采用OpenVINO™工具套件进行转换和优化后,其推理速度较原始方案提升高达8.24倍,且精确度损失不到0.17%;


•通过使用面向英特尔®架构优化的Python,并结合第二代英特尔®至强®可扩展处理器提供的算力支持,放射组学分析方案在基于Radcloud大数据智能分析云平台的医疗科研平台上的推理速度,实现了多达2.08倍至2.12倍不等的提升。


新冠肺炎的突然爆发和大规模流行,对于中国及全球医疗机构而言,是一个在速度和烈度上都堪称严峻的挑战。


控制新冠疫情的原则,和预防及控制其他传染病基本一致,即遵循“三早原则”——早发现、早诊断、早治疗。其中,“早发现”或者说“早诊断”是将被感染者从疑似人群中及时辨识出来,并尽早进行后续隔离治疗的关键步骤。如图一所示,在实践中,中国医疗机构普遍以核酸试剂检测(图一左)为主要诊断方式,以肺部CT 影像检查(图一右)为辅助方式,来对新冠肺炎进行筛查诊断。

图一 新冠肺炎筛查诊断方法图示


核酸检测虽有便捷的优势,但其会受样本病毒含量、病毒是否变异、病毒核酸是否有效提取,以及样本是否合理保存等因素的影响,存在一定概率的检测结果误判,即呈“假阴性”。肺部CT影像检查是通过分析肺部真实影像来判别患者肺部是否出现病变,因此在对早期新冠肺炎症状的检测敏感度上,要优于核酸检测。一项数据表明,在51例患者的检测结果中,肺部CT影像检测对于新冠肺炎的灵敏度为98%,远高于核酸检测(反转录-聚合酶链反应方法)71%的灵敏度。


不过,肺部CT影像检查这一方法的应用“门槛”,要远高于核酸检测,它不仅需要医生具有专业的CT影像分析能力,也需要对新冠肺炎征象有敏锐的临床判断力。例如,新冠肺炎的典型征象之一——肺部磨玻璃影,同时也是多种肺炎、病原体感染的重要征象。因此,医生在分析传统二维的CT影像时,往往需要反复比对判读。遇到更复杂的情况时,可能还需进行多科室会诊。在疫情出现爆发的情况下,这种应对方式显然会造成疫情防控上的延误。


为破解这一难题,让肺部CT影像检查在疫情防控中发挥更及时、更重要的作用,作为全球医学影像AI应用研发领跑者的汇医慧影,开始出动Dr.TuringAI平台作为抗疫先锋,来推动新冠肺炎的快速筛查。


软硬协同优化提升新冠肺炎筛查速度



作为汇医慧影全周期AI医学影像解决方案中专攻AI医学影像辅助诊断的平台,Dr.TuringAI平台可为医院和患者提供“多病种AI辅助应用”及“结构化报告”两大主要功能。它不仅可提供10余种常见疾病的AI辅助诊疗能力,也能实现自动化病灶分割、检测和测量,并输出带有**-RADS分级等信息的AI结构化报告,在帮助医院提升诊疗效率之余,也能助患者获得更精准的诊疗方案。


虽然Dr.TuringAI平台已久经考验,但在面对新冠肺炎的筛查任务时,还是需要进行一些有针对性的优化升级。这些优化升级如图二所示,包括:一方面,平台需要通过收集大量新冠肺炎数据,由专业医生进行标注后,再结合平台内置的深度学习算法,实现对肺炎病灶区的精准分割和测量;另一方面,平台也需要结合InceptionV4、InceptionResNetV2等深度学习算法模型,将原本二维的CT切片进行一系列的“三维”重构,更加清晰直观地反映出病灶的位置、尺寸、面积变化以危重程度等量化数据,为医生提供更全面的病理图像分析,从而帮助他们更快、更准确地进行综合研判。

图二 基于汇医慧影Dr.TuringAI平台的新冠肺炎筛查


上述调整虽然更适用于新冠肺炎的CT筛查,但也会让Dr.TuringAI平台执行推理等过程的计算量和复杂度急剧增加。为了在这种情况下确保令人满意的推理性能,汇医慧影与英特尔一起,在借助第二代英特尔®至强®可扩展处理器实现更强算力支持的同时,还引入了OpenVINO™工具套件,使用其内置的优化工具,将已有的、通过Pytorch深度学习框架构建的NestedU-Net和HR-Net网络模型转换为可利用OpenVINO™工具套件加速的模型,并使用该工具套件提供的推理引擎对整个管道(pipeline)进行了更新。后续进行的基准测试如图三所示,相比优化前用时长达140.3秒,调优后的每数据样本的推理时长仅为48.47秒,平均推理耗时缩短至原先的35%,或者说,其平均推理性能提升高达2.89倍。


图三 使用OpenVINO™工具套件对新冠肺炎CT检测模型进行优化前后的效果对比


这样的性能提升成果,可令新冠肺炎CT影像的筛查速度实现大幅提升。而事实上,这已经不是Dr.TuringAI平台首次从英特尔这一软一硬、协同优化的组合中获取如此强劲的AI加速支持了。此前汇医慧影在该平台上构建以ResNet50卷积网络模型作为基础网络(Backbone)的RetinaNet目标检测模型,来对乳腺癌影像实施模型训练及推理时,就曾使用过这对构成英特尔®至强®平台AI加速技术核心的组合。


由于OpenVINO™工具套件内置有多种优化工具和预训练模型,且能对已训练好的模型进行压缩和加速等优化,来提升模型推理速度,因而汇医慧影当时的优化手段,如图四所示,是先使用它优化用于乳腺癌检测的FP32模型,优化后的模型在推理速度上达到了原始模型的3.02倍;继而,汇医慧影又借助OpenVINO™工具套件,将上述FP32模型转换成INT8模型,在确保模型精确度只受轻微影响的情况下,启用第二代英特尔®至强®可扩展处理器集成的英特尔®深度学习加速技术对于INT8提供的特定加速支持,将其推理速度进一步提升达初始模型的8.24倍,且精度损失还不到0.17%。


图四 使用OpenVINO™工具套件对乳腺癌检测模型进行优化前后的效果对比


不论是对新冠肺炎CT影像筛查的加速,还是对乳腺癌AI检测模型的性能优化,它们的成功都足以证明:第二代英特尔®至强®可扩展处理器与OpenVINO™工具套件的引入和搭配,可以在医学影像分析场景中发挥出“1+1>2”的功效。它们也表明,在众多医疗机构既有的、基于CPU的IT基础设施上部署和运行医学影像类的AI应用,不仅可行,而且高效。


打造全周期AI医学影像解决方案



Dr.TuringAI平台在新冠肺炎等疾病检测,或者说辅助诊断上的优异表现,是汇医慧影与英特尔等合作伙伴一起,通过协作创新助力医疗机构从信息化向智能化转型的又一抹亮色。


这一转型,也确实至关重要。虽说医疗信息化的全面铺开,让各类医疗设备和医用信息系统,尤其是医学影像设备的应用越来越普及,使之成为了各医疗机构、医学科研部门的重要助手,甚至造就了“临床上有超过70%的诊断有赖于医学影像提供支持”的重要成果,但仅有信息化策略推动的硬件设施普及,对提升医疗机构诊疗水平来说还是远远不够的。在大众真实的就医体验中,常会发现在肺结节、乳腺癌、前列腺癌、骨折等一些医疗资源相对紧张的病种诊断上,长时间排队等候、影像分析误判的情况仍是屡见不鲜。


究其原因,是因为医学影像分析不仅需要设备就位,更需要使用这些设备的医生能够熟练掌握临床医学、放射学、医学影像学等方面的专业知识和技能,也需要他们能够充分运用各种影像分析技术,对疾病进行辅助诊断。而有以上综合能力的医生,即便在大医院也是相对缺乏的。

图五 多场景化部署的汇医慧影AI医学影像解决方案


而这也正是众多医疗机构在完成初步的信息化建设之后,就希望进一步借助AI、大数据、云计算等新兴技术手段来完 成智能化转型的目的所在。如图五所示,这也是汇医慧影以旗下Dr.TuringAI平台、Novacloud智慧影像云及Radcloud大数据智能分析云平台等领先产品为抓手,通过公有云、私有云或AI一体机等多场景部署方式,为医疗机构提供全周期、高性能和智能化AI医学影像解决方案的初衷。


如果说Dr.TuringAI平台提供的是高效、便捷的前端医学影像AI分析和辅助诊断能力,那么Novacloud智慧影像云担当的角色,就是为医疗机构和患者提供基于云服务的端到端 AI互动能力。如图六所示,在医生侧,结合Dr.TuringAI平台,影像云可提供多终端AI阅片、远程会诊、转诊等功能;在患者侧,影像云能够提供基于自然语言处理(NaturalLanguageProcessing,NLP)技术的智能报告解读、远程专家咨询及多终端影像阅览等功能;而对医疗机构来说,影像云不仅能对Radcloud大数据智能分析云平台提供支持,也可让管理者以管理驾驶舱的模式,对诊疗、科研进度获得更直观的了解,并支持其对相关策略和计划进行调整。


图六 打通全周期AI医疗影像解决方案的Novacloud智慧影像云


优化版Python改善医疗科研工作效率



如前文所述,与Dr.TuringAI平台、Novacloud智慧影像云并列为汇医慧影全周期AI医学影像解决方案支柱的,还有Radcloud大数据智能分析云平台,它的主要任务是承载医疗机构的科研工作。


目前众多医疗机构都在利用CT、MRI、PET等医学影像,通过放射组学等新技术开展癌症等恶性疾病的早期发现和防治。作为开发放射组学解决方案的领先企业,汇医慧影就正以Radcloud大数据智能分析云平台等产品为基础,为医疗机构提供“全周期”、“一键式”的影像大数据科学分析能力,以加速放射组学等新技术在医疗行业的科研和应用进程。


要进一步了解Radcloud大数据智能分析云平台在放射组学科研项目中发挥的作用,就要先了解什么是放射组学。简而言之,它就是通过将医学影像转换为可挖掘的高通量影像特征数据,并使用特定方法,筛选出最有价值的影像组学特征,进而再通过AI模型训练,建立起具有诊断、预后或预测价值的模型,最终为精准化、个体化诊疗提供有效支持。


图七 放射组学基本分析流程


如图七所示,放射组学的基本流程可分为数据收集、VOI分割、特征提取、特征选择、模型训练以及模型评价及预测等步骤。为了更好地辨识医学影像中的细节,平台在特征提取步骤中会尽可能地提取更多数据特征,因此平台可能会面对“维度灾难”等问题,即指在样本量一定的情况下,随着输入维度的增加,空间数据会变得更为稀疏,这会严重影响模型的预测效果,并大幅增加平台计算量,带来推理效率的下降。


为应对这一问题,汇医慧影与英特尔一起,选择LASSOCV、PCA等特征选择算法,来有效预防科研平台可能面临的维度灾难,并帮助平台在压缩数据的同时保持信息损失最小化。为提升这些特征选择算法的效率,科研平台不仅引入了第二代英特尔®至强®可扩展处理器作为算力基石,还加持以面向英特尔®架构优化的Python,来全面调优其运行效率。


与原生版的Python相比,面向英特尔®架构优化的Python内置最新的矢量化指令,支持更多元化的英特尔®性能库(如英特尔®MKL),同时也对重要的第三方AI知识库sklearn库有着良好的支持,使平台特征选择的执行效率获得了显著提升。


算法优化后的效果如图八所示,其左图反映了勾选全部放射组学特征,采用K-Fold10交叉验证的LASSOCV算法工作负载,采用面向英特尔®架构优化的Python后,其执行速度是采用原生Python时的2.12倍;其右图则反映了勾选全部放射组学特征,采用K-Fold10交叉验证的LASSOCV+PCA算法工作负载,采用面向英特尔®架构优化的Python后,其执行速度是采用原生Python时的2.08倍。


图八 使用面向英特尔®架构优化的Python与使用原生Python时的性能对比


基于英特尔®至强®平台上述软硬件融合输出的AI加速能力,汇医慧影Radcloud大数据智能分析云平台已被引入20余种疾病的研究,并成功申报20余项基金课题。更值得一提的是,平台基于放射组学的AI方案也被用于新冠肺炎的精准鉴别和诊断,并在实践中获得了用户的良好反馈。


未来展望



随着AI、大数据等新技术的落地与持续创新,整个医疗行业正在它们的驱动下迎来巨变,尤其是通过引入创新的AI医学影像解决方案,很多传统意义上的疑难杂症,乃至绝症正在被一一攻克,以往会带来巨大灾难的传染病,也开始在新技术、新平台的帮助下实现更为高效的防控。


面向未来,英特尔还将与汇医慧影等合作伙伴一起,推动更多领先产品技术、尤其是与AI和数据分析相关的产品技术与医疗行业应用需求的深度融合,从而进一步加速医疗机构从信息化到智能化的转型,进而打造出更多样化、也更有价值的智慧医疗解决方案,造福全民健康事业。


(本文由英特尔供稿)