演讲实录丨CAAI副秘书长徐枫副教授:脑疾病诊断中的多模数据应用

科技工作者之家 2021-02-24

来源:中国人工智能学会



2020年11月14日至15日,由中国人工智能学会、嘉兴市人民政府主办,嘉兴市南湖区人民政府、嘉兴科技城管理委员会、浙江未来技术研究院(嘉兴)共同承办的2020第十届中国智能产业高峰论坛(CIIS 2020)在嘉兴南湖举办。在11月15日举办的智能成像与医疗大数据产业专题论坛上,CAAI副秘书长、国家优青、清华大学徐枫副教授为我们带来了题为《脑疾病诊断中的多模数据应用》的精彩演讲。


徐枫


CAAI副秘书长、清华大学副教授、国家优青




以下是徐枫副教授的演讲实录:


前面的报告是基于太赫兹检测技术做的,有一个很强大的硬件系统。在我的报告里会偏软一些,探讨大数据、算法在医学领域中的应用。我谈到的数据是多模数据,包含自然影像和自然视频。


一、背景

我们的研究工作主要围绕脑疾病。脑疾病是对人类健康危害非常大的疾病。这里列举了一些非常严重的脑疾病,包括中风、脑动脉瘤、蛛网膜下腔出血、阿尔茨海默症、脑肿瘤等。 


这是我们机构做的调研。中国人死亡原因排名第一的是脑血管疾病,其次和脑疾病相关的是阿尔茨海默症(AD)。老年病诊疗是一个朝阳行业,随着老龄化加剧,患病人口增长速度也在加快。脑疾病在一定程度上降低了生活质量,非常影响人的正常生活,还会造成很大的专业照顾成本,消耗非常多的金钱。比如,美国每年因AD造成的损失达到2430亿美元;我国也有1600多亿元人民币;欧洲是高福利国家,负担也是非常重的,每年造成 4700多亿欧元经济上的消耗。这是脑疾病的背景。 


我们看一下脑疾病诊疗的发展历程和挑战。西方的医学之父希波克拉底首次描述了中风的现象,使用Apoplexy表示中风,意为被暴力击倒。X射线、CT等影像技术的出现在医学上意义重大。最早使用CT扫描的也是一位患有脑部肿瘤的女性。脑电图可以用来诊断癫痫。血管造影技术通过造影剂可以清晰看到脑血管中的致病信息。还有非常有名的核磁共振,有6次诺贝尔奖都与核磁共振技术相关。核磁共振成像对CT产生了补充,许多在CT无法观察到的东西通过核磁共振成像都可以看到。 


影像对诊断产生了大量作用,治疗才是根本。在医学发展过程中,手术对医疗产生了重要意义。以脑疾病为例,比如中风最早有颈动脉内膜剥脱术,还有溶栓技术。我们利用手术机械装置,可以把栓取出来,这些都是诊断之后做的。


脑疾病的诊断到现在也是一个非常大的挑战。对于卒中来说每延误1分钟就有190万个脑细胞死亡,尽快就诊和确认在医学领域中有着重要意义。此外,为什么希望利用人工智能做技术诊断?因为在我国各地域医疗资源分布不平衡,希望利用人工智能技术,让一些边缘地区获得很好的诊断技术,这使我们迫切需要人工智能的技术在诊疗领域能够发挥一些作用。 


我们团队在脑疾病诊断方面做了一些比较初步的工作。这些初步的探索实际上都是基于人工智能的,我们可以看一下人工智能技术在这些年的发展事件。人工智能技术在近年有着非常大的热潮,这个热潮中有一件事情相信很多人都知道,就是2016年Google研究的AlphaGO战胜了李世石,这个事件引起了轰动,让人工智能获得了一个浪潮,而引起这个浪潮的就是人工智能的深度学习技术。当时很多人工智能领域的科学家都会对深度学习技术产生预测,比如Andrew NG说, 一名训练有素的放射科医生可能比其行政助理面临更大的被机器取代的风险。 


在人工智能技术实际应用中,有如下三个方面的挑战。 


第一,医学数据获取的代价很大。医学数据涉及到的种类非常多,如 CT、MR、EEG、MRI、FMRI,这些数据因牵涉到隐私伦理等,不易获取。像现在非常流行的联邦学习技术,也是希望各个医院数据不从医院出来就能够汇集起来,训练人工智能的模型,获得很好的效果。 


第二,数据标注。除了数据收集之外,其次是数据标注的代价。医学数据标注需要专业知识,需要医生标注,而且希望是具有丰富经验的医生进行标注,这对人工智能来说是非常重要的。但是越是资深的医生工作越繁忙,很难让优秀的医生从繁重临床工作中抽身出来做别的事情。 


第三,医学领域的人工智能可解释性。人工智能有了诊断结果,如果缺乏可解释性,医生和病人就很难相信你,如果没有这样的信任,诊断技术结果是否对后面真正的治疗产生影响就会产生大大的疑问,这些都是人工智能技术落地医疗领域所面对的具体的挑战。 


二、在一些脑疾病上的具体工作

第一个是对脑部几种主要疾病进行诊断识别工作。现在很多人工智能研究只针对某一种疾病进行检测和分析,但是实际上病人来了之后需要先确定是哪一种疾病,第一个任务应该是判断病人有没有病,诊断有病之后也首先考虑发病率较高的、患病人数较多的疾病。 


我们希望不局限在某种疾病上,希望先判断影像数据是有病还是无病,如果有病再判断四种最重要的或者患病人数最多的疾病,就是脑出血、脑梗、脑肿瘤和骨折,我们与医生进行探讨方法, 认为这样做就会有临床价值。我们要面临病灶区域的尺 寸、形态的差异,甚至不同种的疾病在有些情况下会非常相似,比如把肿瘤当成出血,这是非常容易出错的地方。这些都是非常难的问题。 


另外一个难点,医学数据的收集非常麻烦,经常会面临数据规模小、来源单一等问题,导致算法只能在某一个医院上得到好的结果,拿到其他地方效果就很差。还有刚才说的标注成本很高。 


然而没有什么特别好的办法可以解决这些问题。我们做的第一件事情是训练一个很好的泛化模型。用了很长一段时间收集比较大的脑部影像数据库,最终清理后的有效数据是15万病例,数据里包括了发病率比较高的四大类脑部疾病,同时除了有CT数据之外还有一些其他的影像数据,包括核磁的不同序列。我们的数据集和已经公开的数据集相比,数据量是比较大的,病例数多3 倍,相对来说对病种的覆盖也是比较全的;同时还包括一些临床诊断报告的信息。 


有了这些大数据集之后,大数据集是不是一定能让模型有更好的泛化能力?为了做这件事情使用了一些特定的方法,特定的方法也是很多人研究的方法,就是多示例学习方法,我们收集了15万数据,但没有办法让医生全部标注出来。如果使用多示例方法,只需要标注几千例病例,其他则用粗标数据。粗标数据就是基于诊断报告关键字来标注数据,直接利用这种粗标数据需要容忍一些错误标注,以及没有病灶精确位置信息的问题。利用这种多示例学习方法进行研究,在相对大的数据集里进行训练。 


我们得到一些效果,发现数据大确实不错。发现AUC达到了更高的水平;更惊喜的是泛化性比较好,我们没有用有些医院的数据进行训练,但发现在这些数据上AUC维持在这个水平。我们还拿到了印度的CT数据集,他们的数据采集习惯、病人人种与我们的都有一定区别,但是我们的算法在印度数据上也做得比较好,体现了大数据的优势。 


目前,我们在临床比较实验中发现算法已经达到了中等医生年资水平;还发现可以把医生决策和人工智能方法进行融合,而不是简单做对比,因为将来很长一段时间是人工智能算法帮助医生,辅助医生提高诊断率。所以,我们又研究了医生结果和人工智能算法的融合方法,通过这种融合一定程度上会提高诊断的准确,从这个角度来说人工智能算法对医疗诊断还是有效果的。 


我们最后发现,人工智能算法在判断影像是出血还是缺血时,会找出做决策的区域;人工智能找到做决策的区域很多情况下就是病灶所在的区域。从这个角度来讲算法具有可视性、可解释性。医生看到人工智能算法做决策的区域时就会相信这个算法,这也是研究非常好的意义所在。 


我们再探讨一下颅内动脉瘤分割的问题。颅内动脉瘤是造成蛛网膜下腔出血的主要原因,这是一个非常严重的疾病,但这个疾病特点是动脉瘤非常小,检测会造成非常大的困难。比如,前人的工作使用HeadXnet模型在CTA上进行检测,为临床诊断提供辅助。但是因为动脉瘤非常小,CTA扫描的范围较大,这种方法需要对CTA影像进行预处理,这就具有一定的局限性。


我们希望做泛化能力更强,希望医生采集到的数据直接用,不需要做预处理的效果。为了提高泛化能力,在研究中收集了6家医疗机构的数据(这个疾病的数据量非常小的),对这些数据进行了精细标注,并且请高年资医生进行校验,这是一个非常繁重的工作。 


为了找到非常微小的动脉瘤,同时不依赖于预处理的过程,提出了人工智能深度算法的方法。当想找动脉瘤时,可以先找到大概位置,然后逐步放大,再进行精准检测,最后就可以把动脉瘤找到了。在PPT下面可以看到特别微小的动脉瘤也可以通过算法找出来。很多指标我们都获得了非常大的提升,这就是颅内动脉瘤分割工作。 


最后讲一下特发性震颤分级诊断,在这方面利用到了视频数据。特发性震颤是一个神经系统疾病,患病之后恶化非常缓慢,因而就会导致实际上有效救治率非常低(只有27%的人得到了治疗)。震颤病症状和帕金森有点像,病人患病后身体会不受控制颤抖,恶化比较缓慢,老年人都没有特别关注,导致救治率特别低。 


传统的诊断方法需要让病人做特定动作,诊断一个病人需要30分钟,让病人穿上特定服装来检测运动,非常烦琐。这个疾病症状的振动是可以用视频拍到的,所以我们就用视频去做,利用人工智能算法提取骨架信息,然后分析频率和振幅,进而对病人进行诊断。从图中可见,左边的就是病人的振动信息,右边是手机开发的APP,通过APP可以对病人进行自动诊断,病人不需要来医院,非常方便。这个方法和医生进行了对比,上面说的是主观诊断,所以精度提升非常高;我们也利用技术做了辅助系统,发现医生用了辅助之后,对病人诊断有了稳定性的提高。之前稳定性非常低,不同医生打的分是不一样的,差别较大,这样可以减轻 医生的工作量。 


这是我们的一些拓展工作,用视频不仅可以诊断身体疾病,还可以诊断眼部疾病。我们和中山眼科医院合作的一个工作,一方面自动诊断;另一方面用数字人代替真人,保护病人的隐私。 


前面讲到了三种不同数据,未来希望有多种数据的融合,也希望结合硬件做一些工作。我们团队是做大仪器的,可以实现高分辨率的成像,这对疾病成像也会产生巨大意义。



(本报告根据速记整理)

CAAI原创 丨 作者徐枫副教授

未经授权严禁转载及翻译

如需转载合作请向学会或本人申请

转发请注明转自中国人工智能学会


来源:CAAI-1981 中国人工智能学会

原文链接:http://mp.weixin.qq.com/s?__biz=MjM5ODIwNjEzNQ==&mid=2649823400&idx=2&sn=8008d3f04e33cad8c54d7190f100b422

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn