“中国医学影像AI发展现状与思考”专题报告–刘士远教授
刘士远教授现任上海长征医院影像医学与核医学科主任,中华医学会放射学分会侯任主任委员,中国医学影像AI产学研用创新联盟理事长,从事医学影像临床工作长达32年,具有丰富的医教研工作经验。
刘士远教授认为,医学影像将成为医学领域落地较快的一个方向,但是医疗AI影像产品目前也存在诸多难题,因此需要医生、学者专家、公司和政府通力合作,踏踏实实创新和实干,才能推动医疗人工智能行业的健康成长。
刘士远教授谈到,医疗影像行业有望成为较快落地的医学领域,有四个理由:首先,医学是一门靠逻辑归纳、经验学习和循证运用的学科;其次,各家医院都已经积累了海量数据,而深度学习的核心就在于“算法+数据”;而放射科的工作模式就是看图做诊断,便于深度学习AI技术的接入;在各类医疗数据里,放射类的医疗影像又是比较容易获取的类型,可以从这类数据入手来做标注并进行深度学习模型的搭建;根据相关统计,相对于逐年递增的巨大病人群,中国的影像医生存在巨大的需求缺口,这大大促进了影像AI产品的应用和商业化落地。
具体来说,医疗影像AI在临床环境中有很多的用途。比如疾病检出,AI能帮助医生提高早诊率,减少误诊率。这在肺癌筛查、骨折、AD、视网膜病变和病理诊断等领域都有实际应用的例子;还有医学多维测量,多维定量是精准医学的前提,影像AI在这块的应用有病变特征提取、病灶自动分割等;再者就是精准诊断,包括疾病的良恶性判断,精准分级和分期;AI在术前设计和疗效评估等领域也有巨大潜在应用空间。
实际应用层面,目前AI影像产品有很多,在胸部主要集中在肺结节检测和良恶性鉴别上,在神经系统上主要是脑出血检测和定量以AD预测,骨关节方面包括骨折和骨龄的检测,心血管方面则包括冠脉等相应产品的雏形,还有在视网膜病变和皮肤癌诊断等领域AI都有所作为。
就长海长征医院来说,医院已经实现了AI影像产品在肺结节筛查上的日常应用,肺结节良恶性模型还在研究当中,急诊的话还有脑出血和骨折模型产品,骨肿瘤模型也正在研究当中。
值得一提的是,在整个应用环节当中,上海长征医院对医疗数据是采取了很多的安全措施,实现了影像应用不出医院内网,产品有选择性的接收和发送数据,还会对数据进行自动脱敏和定时清理,很好的保护了病人的隐私信息。
上图是其产品的测试结果。可以明显的看到,在钙化结节,5mm以上磨玻璃结节,3-6mm的结节上,AI模型的表现超过了普通医师,而且人机结合以后也比只有医师的表现更好。
上图是其结节AI检测的实际应用场景,它会分析医疗影像并给出诊断报告,还有一键排序结节和一键测量结节等功能。
另外,上海长征医院的医疗影像AI还具备一个进阶功能,那就是判断结节的良恶性,不过还在研发当中。
人工智能现在非常火热,关于医生会不会被AI取代,刘士远教授也发表了自己的观点。
在原理层面,AI的大数据、记忆和计算能力会超过人类,但是神经网络发展的水平决定了机器不可能替代人类。在职业层面,人类的伦理、资质、表情和沟通等能力不会被机器取代。在技术层面,机器确实可以代替人类做重复性技术含量低的工作。
而且,现在的AI医疗产品也还存在很多问题。首先就是实用性差,比如,现在的影像AI产品大多是基于单病种图像标注形成的模型,尚没有符合临床实用场景的产品,而且大多数产品性能的自报数据与实际检测数据不符,鲁棒性有待提高。再加上AI产品往往只是集中在少数几个病种,难以覆盖全部医学影像问题。
在AI模型的研发阶段,数据也是一大难题。首先是现在普遍缺乏标准化高质量的训练数据,国内外虽然有很多公开的数据库,但是存在同质化和人种差异等问题。而且各家人工智能企业和机构采用的训练数据集标准多样,系统偏差较大,整个行业缺乏医学图像和疾病征像的统一认识。最后,整个行业的医疗数据保护和监管措施也是缺失的,数据不能被溯源,也就缺乏合法性和可分享性,还有就是伦理问题,业内缺乏对数据使用标准的判断依据,在现有的法律基础上寻找合规使用和分享数据的渠道,也是迫在眉睫的一件事情。
他建议到,要构建标准库,离不开医生的参与。要形成与AI研发相关的标准和数据,需要在图象的采集环节,标准库的构建环节,病种的分布以及各种描述术语等等都要达成一定的共识。
好消息是,国家在近期颁布了《国家健康医疗大数据标准、安全和服务管理办法(试行)》。
另外,在肺结节领域,中检院肺结节AI检验数据库标定专家组已经完成肺结节标准数据集建设。
图像标注环节也存在很多问题。以肺结节标注过程为例,主要存在以下问题,标注者队伍混乱,资质不一;图像征象认识不统一;图像标注方法不统一;图像分割方法不统一;图像量化方法不统一。
中检院在构建肺结节标准库的过程中,从全国招了250名5年以上经验的影像科医生志愿者,对他们进行了简单的测试,使用了30例结节,结果准确率只有30%,说明了如果没有共识和基础培训,医生的标注准确率是很低的,非影像科医生甚至不是医生的准确率就更难以想象了。还有就是标注的方式,有的使用紧密包裹法,有的使用区域标注法,有的使用其他方法等,不同的标注方法输出的结果也不尽相同。图像分割如果没有统一的标准,结论的差别也会非常巨大。还有量化的方法,到底是测直径,还是测体积,还是测质量,怎么测,都需要形成一致意见。
在医学影像AI模型检测阶段,也会存在生产过程不规范,模型效果和安全性缺乏公正评价,缺乏产品检测标准库和评价体系,缺乏相关法律法规、质控检查和管理制度等问题。
在AI模型使用阶段,受欢迎程度,对医生的影响,过多的假阳性,伦理和法规,是否匹配医院和医生的需求等问题也尚待解决。如上图,点击率代表病人对产品质量和准确性的信赖程度,越受欢迎,点击率越高;另外,产品该怎么和医疗流程整合也是一个问题,是游离于信息系统之外,还是融合于信息系统之内,都需要考虑;还有人担心年轻医生对AI产品产生依赖之后,会导致业务能力下降,包括看结节的能力;现在AI产品检出过多假阳性的结节还导致了焦虑和恐慌问题;还有伦理问题,包括数据的伦理和产品的伦理问题。数据的伦理就是数据的所有权、许可权和隐私权都需要制定规范,现在卫计委已经发布了相关标准和规范。第二个就是产品的伦理问题,随着产品的逐渐落地,产品的责任和影响都需要伦理的相关准则来考虑。
因此,医学影像AI模型的发展需要满足临床需求,既需要符合医疗流程,也需要符合临床场景,还要符合检查部位要求,还要能与医生、研究人员和企业进行协作配合。
作为一名医生,刘士远教授还强调,影像诊断是全链条、多维度的工作,工作内容不仅仅是图像识别,需要充分发挥医生在医学影像AI研发过程中的作用。
医生是医学影像AI产品研发的领导者,机器要做人类的助手,负责阅图、分析和判断等工作,而不是做竞争者。
反过来,医生也是医学影像AI模型的培育者和导师。在数据上,医生可以建立大样本的单病种数据库,提高训练数据质量,并在此基础上规范化标注,形成高质量训练集,还要学会在法律法规下分享和使用数据。
医生还应当成为质量控制和标准的制定者和执行者。比如制定图像采集和图像质量的标准,制定数据库建设的构成比例、病种分布、病灶类型等专家共识,并形成各单病种影像征象和描写属于以及单病种AI模型数据标记专家共识。
在AI伦理上,医生也是主角。医生可以建立一套正确的基本伦理准则来指导AI的设计、管理和实用。
最后,刘士远教授呼吁,AI现在还是一个尚不成熟的产品,需要医生去拥抱它,呵护它,引导它。当然也要避免另外一种情况,就是夸大宣传,夸大宣传容易误导政府和民众,不利于行业健康发展。
刘士远教授最后表示,虽然现在形势一片大好,但是医学问题其实是很复杂的,场景复杂,维度多,任务多,这需要我们医工结合,沉下心来,踏踏实实的创新和积累才能解决问题。