人工智能Sybil可据单次CT扫描结果预测肺癌风险
美国麻省理工学院Mikhael等报告,一种名为“Sybil”的人工智能(AI)工具能够根据单次低剂量CT(LDCT)扫描结果即可预测出短期和长期的肺癌风险。(J Clin Oncol. 2023年1月12日在线版)
在开发Sybil的过程中,研究人员获得了15 000例NLST样本的影像学和临床数据,这些LDCT队列参与者被分为训练组、开发组和测试组。外部验证数据来自另外两项大型中心的LDCT筛查数据,分别为麻省总医院(MGH)2015~2021年6392名成人的
13 309份数据和中国台湾长庚纪念医院(CGMH)2007~2019年10 696名成人的12 480份数据。CGMH数据与NLST数据和MGH数据不同,即:包括无癌症病史和无吸烟史,但却有LDCT数据的任何成人。
结果显示,Sybil在这两个独立测试集中的表现与在NLST数据集中的表现相当,MGH数据中1年肺癌预测时的受试者工作特征曲线下面积(AUC)为0.86(95%CI 0.82~0.90),CGMH数据中为0.94(95%CI 0.91~1.00)。6年时的一致性指数分别为0.81(95%CI 0.77~0.85)和0.80(95%CI 0.75~0.86)。
当在分析中去除可识别的已知的癌性肺结节时,模型的性能有下降,2年预测时的AUC为0.81(95%CI 0.74~0.86),6年预测时的AUC为0.69(95%CI 0.63~0.74),但总体而言Sybil“仍然具有预测能力”。
此外,Sybil不但可降低基线扫描的假阳性率,且能保持住同等的检测敏感性。
在NLST训练集,Sybil能够预测1年内的肺癌情况,AUC为0.92(95%CI 0.88~0.95),预测2年时的AUC为0.86(95%CI 0.82~0.90),6年预测的一致性指数为0.75(95%CI 0.72~0.78)。
在性别、年龄和吸烟史各亚组中,Sybil的表现仍得以保持,其结果在总计超过23 000例LDCT筛查的两个大型独立数据集上得到了验证。
有评论者强调:研究人员为了使他们模型获得“正确”结果而进行了“深度和广度”并重的探究,但该模型的整体性能确实“优异”。从实际角度来看,预测工具存在不需要患者的人口统计数据、风险因素/人工验证、淋巴结特征等优点,而这些特征参数的获得都需要时间和专业知识来支撑。
此外,该模型还有如下优点:可以减少不必要的检查和有创性操作的应用;能预测出哪些患者可以安全地延长筛查间期,其中患癌风险极低者甚至可以完全停止筛查;能发现目前不符合美国预防服务工作组筛查标准的高危人群。 (编译 王婧涵)