AI读片可对原发灶不明肿瘤溯源
美国哈佛大学研究者通过训练一个卷积神经网络(CNN)模型,仅依靠读取患者的病理切片,便能实现对原发灶不明癌症的溯源。(Nature. 2021, 594: 106-110 DOI: 10.1038/s41586-021-03512-4)
人工智能(AI)的进步推动了各个行业的发展,通过将AI图像识别技术和医学影像资料相结合,在多个医学影像读片或诊断任务中,AI已经能够达到甚至超越专业医生的水平。
该研究又一次实现了AI与癌症诊疗的完美结合。若该研究成果得到验证并投入临床应用,就意味着仅需一张普通病理切片,医生就能确定原发灶不明肿瘤的范围。
原发灶不明肿瘤(CUP)是一类“经过详细的检查,但始终无法确认癌症原发灶”的转移性肿瘤的统称,在所有癌症患者中占比1%~2%。这类患者往往会经历各种各样的检查,最终只能依据经验联合使用放化疗,经济负担很重但普遍预后较差,中位生存时间仅为2.7~16个月。
有研究者利用基因组学技术寻找CUP的起源,但表现并不令人满意,基因组学检测对于CUP患者来说也是不小的经济负担。
既然没有寻找原发灶不明肿瘤来源的手段,能否依据现有检查结果来预测肿瘤来源?图像识别任务向来是AI的强项,研究者通过学习大量患者的苏木精伊红染色(H&E)病理切片,以弱监督的方式训练出一个CNN模型(命名为TOAD)。在读取一张病理切片后,TOAD能对人体的18种组织进行预测打分,通过对预测分数进行排序,以找到肿瘤最可能的组织来源。
研究者从公共数据库与布列根和妇女医院中收集了来自29 107例患者的32 537 张H&E染色切片,分别标记为18种原发癌源。按照70%、10%、20%的比例划分为训练、验证和测试数据。通过反复的训练和优化模型,TOAD在测试数据中的Top-1准确率为83.4%,Top-3准确率为95.5%,而Top-5准确率达98.1%。
为了探讨TOAD是否具有普适性,研究者从223家医学中心收集了682例患者的数据进行预测。在这些数据中,TOAD的Top-1准确率为79.9%,Top-3准确率为93.4%。
研究者采用“是否通过免疫组化(IHC)进行诊断”来定义诊断难度。对于那些不需要IHC就能完成诊断的患者,TOAD的Top-1准确率为87.4%,Top-3准确率为96.7%。而对于那些需要三次或以上IHC才能完成诊断的患者,TOAD的Top-1准确率为75.7%,Top-3准确率为92.0%,提示就算是那些诊断困难的癌症患者,AI依然能很好地完成预测。
研究者从152家医学中心收集了743例患者数据,这些患者均在诊疗过程中的某一个时段被诊断为CUP,其中的317例患者经历彻底的临床和辅助检查之后,最终确定了肿瘤来源。研究者选择这317例患者的切片进行原发灶预测。
分析发现,TOAD对于这些数据的Top-1准确率下降到60.6%,但Top-5准确率仍达92.1%。表明即使是面对临床中最难诊断的CUP患者,TOAD仅仅通过读取病理切片,便能很好地提示缩小癌症的可能来源。
研究结果显示,TOAD能成为肿瘤科医生非常好的辅助工具。在资源有限地区,TOAD能够为普通肿瘤患者提供很好的诊断参考,而不需进行额外的检查。对于那些诊断困难的肿瘤患者,TOAD也能极大地缩小诊断范围。有了TOAD作为参考,临床上在转移灶溯源时不必再仅凭经验和运气,将使诊疗策略更具目的性,更高效地完成诊疗。 (编译 赵佳加)