2019年3月 第229期

国人完成全球首个AI随机临床试验 AI可使结肠镜的腺瘤检出率提高近50%

四川省人民医院的刘晓岗团队与哈佛医学院研究者联合完成全球首个AI前瞻性随机对照临床试验,试验发现AI可使结肠镜对腺瘤检出率提高近50%。每例患者检出的平均腺瘤数也增加,主要是AI检出了更多的较小腺瘤。(Gut. 2019年2月27日在线版 doi:10.1136/gutjnl-2018-317500)

这是全球首个使用基于深度学习的计算机辅助检测系统的前瞻性随机对照临床试验,辅助结肠镜息肉检查,具有开辟性的意义。

该研究在四川省人民医院进行,研究共纳入1058例患者,随机分为两组,一组接受标准结肠镜检查(536例),另一组接受AI系统(实时自动息肉检测系统)辅助的结肠镜检查(522例)。

在AI组中,结肠镜连接到AI系统,监视器上会显示用蓝色空心框圈出的息肉位置,同时发出警报声,医生主要负责盯好监视器,在警报声提示检测到息肉时对息肉进行评估,判断是否是息肉,是否是腺瘤性息肉。

该研究所用的AI系统是在深度学习架构上开发的,2018年,刘晓岗团队在《自然·生物医学工程》杂志上发表研究,报告了这一系统。系统的建立基于2007年至2015年间,1290例患者的5545张结肠镜检查图像,其中有3634张检出息肉。

研究者共使用4个数据集对这一系统的识别能力进行了验证。数据集1和2使用的是结肠镜检查图像,其中系统的敏感性可达到94.38%,特异性达到95.92%,受试者工作特征曲线下面积(AUROC)为0.984(评价统计模型预测准确性的指标,越接近1,准确性越高)。

与数据集1和2不同,数据集3和4使用的不是检查图像,而是检查视频,数据集3是包含息肉的检查录像片段,4则是经多名专家确认无息肉的患者的全部检查录像。从静态到动态,这对于系统来说无疑是增加了难度,但另一方面,这种检验也更加贴近实际的临床应用。

结果也未让研究人员失望,数据集3中视频的逐帧敏感性达到91.64%,而对息肉检查的敏感性更是达到100%!数据集4的特异性也高达95.40%。

通过多线程处理系统,AI对实时视频的处理速度能达到每秒至少25帧,延迟时间为76.80±5.60毫秒,可以说是将图像实时输出,不会影响医生的操作。

基于这些结果,研究者开展了这项临床试验。检查所需时间上,AI组所需时间为6.89分钟,仅比对照组标准结肠镜组长0.5分钟,也均未出现与肠镜检查相关的并发症。

从息肉的检查结果看,两组共检出了767个息肉,其中有422个腺瘤,对照组和AI组的息肉检出率分别为29%和45%,差距明显。在检测出腺瘤的患者中,对照组和AI组检测到的平均腺瘤数分别为0.31和0.53,腺瘤检出率分别为20%和29%,增加了45%。两组间的差距主要是由于AI组检测出的小腺瘤较多(185 vs. 102),较大腺瘤的检出数量虽也有差距,但不具统计学意义。

可见,AI组在正面结果的对比上显示了优势,那么负面结果,也就是漏检和错检的结果如何?研究者分析发现,AI系统一共有39次错误警报,平均到每次结肠镜检查上约为0.075次,错误率较低,且未出现漏检。

该项临床试验表明,在AI的辅助下,结肠镜检查能发现更多的腺瘤,尤其是小腺瘤。尽管小腺瘤相对恶变的风险较小,但总体腺瘤检出率的提高最终可能降低肠癌风险,不过这一目标的实现还需进一步长期随访研究验证。 (编译 崔伊媛)

+A -A