把计算机训练成可诊断肺癌的病理医生
美国斯坦福大学Kun-Hsing Yu等的一项新研究表明,计算机可用于分析肺癌患者组织的HE染色切片,其诊断正确率高于有经验的病理科医生。这一方法能够准确鉴别肺的良恶性组织及肺鳞腺癌,并能预测患者的生存。(Nat Commun. 2016年8月16日在线版)
研究者自癌症基因组图谱(TCGA)项目中获取了1017例患者(515例肺腺癌,502例肺鳞癌)的2186张病理学切片图像,其中包括癌症组织和癌旁良性组织,并将其随机分成训练集与测试集。测试集还纳入了来自斯坦福组织芯片(TMA)数据库的294张组织芯片图像(227例肺腺癌,67例肺鳞癌),以检验训练集的数据。研究者将训练集TCGA队列的组织病理图像、病理报告和临床信息输入到计算机中,利用软件进行后处理。所有的病理学图片被平铺分块,计算机自动选取每张图片中10个最密集的地方,最终为TCGA队列中每例肺癌患者选取了超过500万个图像块,提取了每一个图像块上9879个定量化的形态学信息,包括细胞大小、形态、细胞及细胞核的像素强度分布情况、细胞及细胞核的质地等,并将这些量化的信息输入到“分选器”中,以构建诊断或预测模型。
该研究首次证实:量化的细胞形态学特点具有生物学相关性,可用于鉴别恶性组织与癌旁正常组织。经过“分选器”选出的80种量化数据中鉴别良恶性组织方面的准确率超过85%,而两位资深的病理科医生评估相同切片的准确率仅为60%。研究者运用同样的方法在TCGA和TMA数据组中选出240个量化数据以鉴别肺腺癌和肺鳞癌,准确率超过75%。
此外,该研究还证实了量化的形态学特点具有一定的生存预测价值。相同分期患者的转归差异较大,很难通过肉眼观察HE染色切片来预测。但量化的图片特点可以显示肉眼观察不到的肿瘤细胞形态学差异,从而有效地鉴别长期生存者与短期生存者。同样的方法在肺鳞癌中也适用,所不同的是,60种量化数据对肺腺癌有预测价值,而肺鳞癌为15种。
目前,多种恶性肿瘤的治疗依赖于病理分型,计算机对病理学图像的处理成为新的研究热点。这种客观的评估方法可以弥补病理科医生主观分析的不足,但不能替代医生的诊断。通过一些量化的病理学图像数据进行肿瘤分型并预测生存,可以帮助临床医生进行个体化治疗。
(编译 周旻 审校 卢铀)
