国人构建肠道微生物早期肝癌诊断模型
浙江大学医学院郑树森院士和李兰娟院士,以及郑州大学第一附属医院阚全程教授合作,描述了从健康到肝硬化以及从肝硬化到早期肝癌过程中,粪便微生物的变化,还找到了30个最佳的区分早期肝癌和健康人的微生物标志物,并且在不同地区的癌症患者样本中得到了验证。(Gut. 2018 年7月25日在线版. doi: 10.1136/gutjnl-2017-315084)
研究者在华东、华中和西北地区共收集486份粪便样本,经过严格的病理诊断和调查,纳入浙江地区的150例肝癌患者、131例健康人对照和40例肝硬化患者,随机分为诊断模型构建队列和验证队列(构建队列包括75例早期肝癌患者、75名健康人和40例肝硬化患者;验证队列包括30例早期肝癌患者、45例晚期肝癌患者和56名健康人)。486份粪便样本中来自新疆的18例肝癌患者及来自郑州的80例肝癌患者单独组成另一组验证队列,用来检验这个早期诊断模型在跨地区患者群体中的效果。
研究者发现,肝硬化患者的肠道微生物多样性与健康人相比显著降低,而早期肝癌患者相比肝硬化患者却显著增加。与肝硬化患者相比,早期肝癌患者的放线菌门细菌明显增加,而且,包括Gemmiger、Parabacteroides和Paraprevotella在内的13个属的细菌明显富集。
与健康人群相比,早期肝癌患者疣微菌门(Verrucomicrobia)细菌明显减少,从属的水平上来看,包括Alistipes菌属、考拉杆菌属(Phascolarctobacterium)和瘤胃球菌属(Ruminococcus)在内的12个属的细菌也明显减少。包括克雷伯氏菌属(Klebsiella)和嗜血菌属(Haemophilus)在内的6个属的细菌则增加。
通过比较,研究者确定,肝硬化患者与早期肝癌患者,以及健康人与早期肝癌患者之间的肠道微生物组成差异很大,提示应用肠道微生物特征区分健康人与早期肝癌患者或许是可行的。
研究者接下来构建了一个用来诊断早期肝癌患者的随机森林(random forest)分类模型。随机森林模型是一种比较新的机器学习模型,比经典的机器学习模型预测精度更高,且不显著增加运算量。
研究者从模型构建队列发现的110个与早期肝癌相关的OUT(通过基因测序,序列相似度超过97%的DNA片段归为一类,组成临时分类单位即OUT,一个OUT相当于一个菌种)中,筛选出30个预测效果最佳者,预测模型AUC值达80.64%(AUC值衡量预测模型优劣,越接近1表明预测越准确)。
在模型验证方面,浙江地区验证队列中,诊断模型区分健康人和早期肝癌患者的AUC值达76.80%,区分健康人和晚期肝癌患者的AUC值为80.40%。在新疆和郑州的验证队列中,诊断模型也有较好的预测效果,AUC值分别为79.20%和81.70%。
实际上,用肠道微生物来构建疾病诊断或预测模型是学界重要的研究方向,在结直肠癌中也取得一定研究成果。该研究又证实了肠道微生物预测模型在肝癌中的作用。研究者表示,未来需要更大样本来自不同种族人群的研究对该模型予以完善和证实,希望可以为早期肝癌检测提供基于肠道微生物的新方法,让患者及早接受治疗。
(编译 王钰)