英国CanPredict(lung)模型可风险分层及指导筛查
英国牛津大学Liao等报告,新开发的CanPredict(lung)模型基于2个英国初级保健数据库1967万人的数据,并获得了内部验证和外部验证。其对英国初级保健人群的风险分层和选择肺癌高危个体进行靶向筛查均具有潜在的效用。(Lancet Respir Med. 2023年4月5日在线版)
为了开发和验证一种供英国肺癌筛查使用的风险预测模型——CanPredict(lung)模型,并与其他7种风险预测模型的性能进行比较,该项回顾性人群队列研究关联了2个英国初级保健数据库的电子健康记录:QResearch数据库(2005年1月1日至2020年3月31日)和CPRD Gold数据库(2004年1月1日至2015年1月1日)。主要终点为肺癌的偶发(散发)性确诊病例。
推导队列的数据来自QResearch数据库,包括1299万25~84岁的个体,研究者使用Cox比例风险模型来构建男性和女性的CanPredict(lung)模型。按性别和种族,研究者使用区分度(Harrell's C统计量、D统计量、能解释至肺癌确诊时间的变异R2D)和校准图评估模型的性能,其中QResearch数据库中有414万人用于内部验证,CPRD数据库有254万人用于外部验证)。
供对比的7个肺癌风险预测模型依次为LLP v2、LLP v3、LCRAT、PLCO M2012、PLCO M2014、匹兹堡模型和Bach模型,模型性能对比样本集包括:55~74岁曾经吸烟者(英国推荐接受肺癌筛查的人群)中的对比和在各模型资格标准确定后的人群中对比。
结果显示,随访期间,QResearch数据库推导队列中有
73 380例肺癌病例,QResearch数据库内部验证队列中有22 838例,CPRD数据库外部验证队列中有16 145例。最终模型中的预测因子包括社会人口学特征(年龄、性别、种族、Townsend评分)、生活方式因素(体质指数、吸烟和饮酒状况)、合并症、肺癌家族史和其他癌症的个人史。女性和男性的模型中,部分预测因子不同,但模型性能相似。
按性别和种族分层,CanPredict(lung)模型在全模型的内部验证和外部验证中均显示了出色的区分度和校准度。在QResearch数据库验证队列中,该模型能解释两性间65%的至肺癌诊断时间变异(R2D),能解释CPRD数据库验证队列中两性间59%的R2D。在QResearch数据库验证队列和CPRD队列中,Harrell C统计量分别为0.90和0.87,D统计量分别为2.8和2.4。
与其他7个肺癌预测模型相比,CanPredict(lung)模型在2个样本集的3个预测时间范围(5年、6年和10年)内的区分度、校准和净获益方面均表现最佳。CanPredict(lung)模型也比目前英国推荐的模型(LLPv2和PLCO M2012)具有更高的敏感性,因为在筛查相同数量的高危个体时它比那些模型能分辨出更多的肺癌病例。
(编译 王垚松)