2022年4月 第301302期

国人研究早期肺癌血液筛查新方法

北京大学人民医院王俊院士与北京大学系统生物医学研究所尹玉新教授团队,结合单细胞测序(scRNA-seq)、非靶向脂质组学、质谱多反应监测(MRM)等技术,开发了一种早期肺癌筛查的方法——LCAID v2.0,该方法有较高的灵敏度和特异度,可用于肺癌的早期检测以及高危人群的大规模筛查。(Sci Transl Med. 2022年2月2日在线版 DOI: 10.1126/scitranslmed.abk2756.)

研究者首先对5例初治早期肺癌患者的原发肿瘤进行了单细胞测序(scRNA-seq),同时分析了公共数据库中8个健康供者样本的单细胞测序数据。结果发现,与正常肺组织相比,肺癌组织中T淋巴细胞、B细胞和浆细胞的相对百分比增加,单核巨噬细胞和内皮细胞的相对百分比下降。

研究者通过对比正常上皮细胞与肿瘤细胞的差异表达基因(DEG)发现,许多下调的DEG富集在脂质代谢途径,提示早期肺癌中存在脂质代谢异常。对独立scRNA-seq数据集的分析也得到类似结果。与正常肺组织相比,早期肺癌组织多种类型细胞中甘油脂和甘油磷脂代谢途径均下调,其中,甘油磷脂代谢改变最为显著。研究者推测,早期肺癌中脂质代谢广泛失调。

研究者使用高效液相色谱质谱联用技术(HPLC-MS)对早期肺癌患者的血浆脂质组学进行了研究,对171例肺癌患者和140名健康对照者的血浆进行非靶向脂质组学检测。每个样本在正离子模式下共鉴定出14类脂质的1478种代谢物,在负离子模式下共鉴定出13类脂质的708种代谢物。

根据检测到的所有脂质,使用支持向量机(SVM)算法对患者和健康对照进行分类。将311个样本随机分为训练数据集和测试数据集,训练数据集包含75%的样本,其中129为肺癌患者,105名健康对照;测试数据集包含42个肺癌患者和35名健康对照者。

将以上过程重复2000次,每次迭代中随机选取样本进行训练和测试,并进行评估。在正、负离子模式下,数据平均测试准确度、特异度和灵敏度均达到95%以上,提示利用SVM分析脂质组学数据可作为一种检测肺癌的方法。

研究者将这种基于血浆脂质组学和机器学习(ML)的方法命名为——肺癌人工智能检测器(LCAID) v1.0。基于SVM算法和LC-MS的特征选择,研究者最终筛选出9个血浆脂质标志物,使用这9种脂质标志物对数据进行训练和评估,测试数据集的分类精确度为98.90%,平均AUC为0.9994,提示所选的九个血浆脂质标志物可以较好地区分早期肺癌和健康对照。

研究者假设对选定的血浆脂质标志物进行定量,可提高数据稳定性和检测准确性。应用MRM技术,研究者开发了一种脂质靶向检测方法,经过校正LC洗脱梯度等参数优化后,该方法可在19分钟内迅速对这9种脂质标志物进行量化。这种定量方法被命名为LCAID v2.0。

研究者对来自4个医疗中心的1003名受试者血浆进行了检测。LCAID v2.0在训练队列和独立验证队列中显示一致的表达模式,训练队列的AUC达0.9956,独立验证队列AUC达0.9982,证实了LCAID v 2.0的可靠性和准确性。

研究者对LCAID v2.0在肺癌临床检测和筛查中的作用进行了验证。在包含109名受试者的前瞻性队列研究中,86名受试者被诊断为肺癌(TNM分期Ⅰ~Ⅲ期),23名参与者诊断为良性疾病。LCAID v2.0应用于该队列的准确性达91.74%,特异度为95.65%,敏感度为90.70%,AUC达0.9843。

筛查队列纳入1036名每年接受LDCT筛查的受试者,在这一队列中,LCAID v2.0的分类准确率达到96.53%,特异度和敏感度分别为96.58%和92.31%。多因素logistic回归分析显示,LCAID v2.0评分是肺癌的唯一独立预测因素,且LCAID v2.0评分绝对值越高,肺癌患者的生存率越低。

LCAID v2.0的总体工作流程包括样品采集(20分钟)、样品处理(50分钟)、质谱分析(20分钟)和数据分析。整个过程完成总时间约为90分钟,可同时处理多达24个样品,便于进行大规模检测。该研究提示,LCAID的准确性和高特异性有助于肺癌的早期检测以及高危人群的大规模筛查,从而减少不必要的辐射暴露和侵入性诊断的应用。

(编译 余华)


+A -A