2022年2月 第297298期

AI辅助前列腺癌诊断分级准确率高

荷兰Radboud大学医学中心Bulten等报告,在前列腺癌的诊断和分级方面,人工智能(AI)和泌尿病理学专家,都优于普通的病理学家。(Nat Med. 2022年1月13日在线版 DOI: 10.1038/s41591-021-01620-2)

为了解决各国临床实践中AI算法的通用性问题,迄今为止规模最大的组织病理学竞赛PANDA包括1290名深度学习算法开发人员,以一组包括10 616份数字化前列腺活检结果的样本为学习蓝本,然后在一组393份数字化载玻片样本中由1~6名泌尿病理学专家提供诊断结果以验证AI算法检测的准确性。最后,再邀请了15个团队在另外1616 张幻灯片上进行验证。

在比赛的前10天内,一种算法与泌尿病理学专家的一致性大于0.90;到第33天,所有团队人类专家的诊断一致性中位值均大于0.85。

结果显示,受验算法诊断的一致性更高,平均为0.931(95%CI 0.918~0.944)。这些算法能在99.7%(95%CI 98.1%~99.7%)的病例中正确检出肿瘤,并能正确识别92.9%(95%CI 91.9%~96.7%)的阴性结果。当根据Gleason分级后,与由13位或20位普通病理学家组成的国际小组相比,该算法与泌尿病理学专家的一致性明显更高。

AI算法的癌症漏诊率为1%~1.9%,而普通病理学家为1.8%~7.3%。该算法对肿瘤的敏感性为96.4%~98.2%,特异性为75%~100%,而病理学家的分别为91.9%~96.5%和92.3%~95%。

研究者表示:在AI的支持下,普通病理学家可以与泌尿病理学专家达成更高的诊断一致性,或可降低Gleason分级相关的评估者间的变异性。不过,AI算法仍存在将良性病例错误分类的情况,主要为将其误分类为ISUP GG 1癌症,推测与训练数据和验证数据间病例分布的变化相关。

(编译 黄岩)


+A -A