新闻资讯

Nat Med|揭开衰老之谜——蛋白质组衰老时钟如何预测年龄相关疾病的风险

2024-09-02
中科新生命
797

年龄是常见慢性病和死亡原因的主要决定因素,随着时间的推移,人体的生理完整性和功能性会逐渐丧失,最终导致重大疾病的发生。而量化并干预生物衰老可能对预防多病共存和过早死亡具有重要作用。由于个体在年龄相关疾病的发病时间和严重程度上存在很大差异,实际年龄是衡量“生物”衰老的一种强有力但并不完美的预测指标。蛋白质平衡的丧失是衰老的主要标志之一,先前的研究已经确定了衰老相关蛋白(APs),并利用其开发了蛋白质组年龄时钟来预测某些疾病和死亡的风险,但研究规模较小,且未在不同祖先群体中进行独立验证。

2024年8月8日,英国牛津大学纳菲尔德人口健康系研究团队在Nature Medicine(IF 58.7)杂志上发表了题为:Proteomic aging clock predicts mortality and risk of common age-related diseases in diverse populations的研究成果,通过Olink Explore 3072蛋白质组学技术方法和机器学习算法,开发了基于204种蛋白质的衰老时钟和基于20种蛋白质的简化衰老时钟,发现蛋白质组衰老可以预测18 种主要慢性疾病的发病率以及多病共存和全因死亡风险。

 

 

 研究材料

三个研究队列参与者的血浆样本;

发现队列:英国生物样本库(UKB)45,441例参与者;

验证队列:中国慢性病队列研究(CKB)中3,977例缺血性心脏病参与者和芬兰生物库(FinnGen)1,990例参与者;

 

 

 技术路线

步骤1:构建蛋白质组衰老时钟;

步骤2:蛋白质组衰老时钟预测衰弱和衰老表型;

步骤3:蛋白质组衰老时钟预测常见疾病;

步骤4:衰老相关蛋白的生物功能和蛋白质互作网络;

步骤5:与现有DNA甲基化和蛋白质组衰老时钟的比较。

 

 

 研究结果

1. 构建蛋白质组衰老时钟

将UKB队列随机分为70%的训练组和30%的测试组,以开发蛋白质组衰老时钟。在训练阶段,比较了六种机器学习方法(LASSO、弹性网络、梯度提升和三种神经网络)训练的衰老时钟模型。选择梯度提升(LightGBM)作为最终模型,并结合Boruta特征选择算法和SHAP值从2,897种蛋白质中获得204个APs。ProtAge模型在UKB测试集和CKB、FinnGen独立验证集中的R²值分别达到0.88、0.82和0.87。ProtAge预测年龄和实际年龄之间的差异(ProtAgeGap)在男性和女性、种族和不同地理区域均具有相似的分布。进一步,基于SHAP值采用递归特征消除法进行特征选择,简化了由20个关键蛋白质组成的模型(ProtAge20),该模型的年龄预测性可以达到204个蛋白质模型的95%。

图1 跨队列的蛋白质组衰老时钟性能

 

2. 蛋白质组衰老时钟可预测衰弱和衰老表型

在UKB队列中,除两个肝脏生物标志物(丙氨酸转氨酶和总胆红素)外, ProtAgeGap与所有生理和认知功能均显著相关。ProtAgeGap的增加与两种肾功能生物标志物(胱抑素C和肌酐)、两种肝酶(天冬氨酸转氨酶、γ-谷氨酰转移酶)和C反应蛋白水平的升高有关;并与白蛋白、IGF-1和端粒长度下降有关。除舒张压外,ProtAgeGap20与所有衰老功能表型相关。与204种蛋白模型相比,ProtAgeGap20在衰老生物学指标(如端粒和白蛋白)方面预测能力更强,而在预测衰弱和生理/认知功能指标方面偏弱。

图2 ProtAgeGap与年龄相关的生物、生理和认知功能有关

 

3. 蛋白质组衰老时钟可预测常见疾病

在UKB队列中,ProtAgeGap最高、中位数和最低十分位数的参与者在全因死亡率和14种常见非癌症疾病的年龄特异性发病率存在差异,女性和男性的累积发病率轨迹相似。在UKB和CKB中,高ProtAgeGap参与者全因死亡率、IHD、糖尿病和心脏病风险更高。

图3 ProtAgeGap将UKB和CKB中不同年龄特异性死亡率和疾病风险分层

COX回归模型发现,在UKB队列中,ProtAgeGap与全因死亡率和除帕金森外的所有非癌症疾病显著相关,尤其是AD、全因痴呆和CKD。ProtAgeGap20与所有研究的疾病相关,包括帕金森病。构成ProtAge20的20种蛋白质与多种主要慢性疾病相关,其中GDF15与大多数疾病关联最强。并且ProtAgeGap随着多重疾病的增加而增加。表明蛋白质组衰老时钟可以预测多种主要慢性疾病。

图4 ProtAgeGap与死亡率和常见疾病关联的效应量在协变量调整中基本不变

 

4. 衰老相关蛋白的生物功能和蛋白质互作网络

对构成ProtAge模型的204种APs进行功能分析,发现在解剖结构和发育过程中显著富集。PPI分析发现其形成了由66个蛋白组成的高度互联的子网络,中心节点包括EGFR、CXCL12、ITGAV、CXCL9和CD8A。而构成ProtAge20模型的20种APs主要参与细胞粘附、细胞外基质(ECM)相互作用、免疫应答、炎症、激素调控与生殖、细胞信号传导、神经元结构与功能等。

图5 ProtAge衰老相关蛋白的蛋白-蛋白相互作用网络

 

5. 与现有DNA甲基化和蛋白质组衰老时钟的比较

与DNAm时钟相比,ProtAge模型的蛋白质与主要的DNAm时钟(如Horvath clock、DNAm PhenoAge和DunedinPACE)的基因重叠程度较低。ProtAge模型与三项已发表的蛋白质组衰老时钟蛋白质有一定重叠,但ProtAge模型中有134个蛋白质(64%)未在先前研究中报道,表明ProtAge模型发现了新的APs集合。重叠的15个Aps与DNAm时钟的相应基因无重叠,表明DNAm和蛋白质组时钟可能涉及在不同的基因集。

图6 ProtAge衰老相关蛋白与现有DNAm和蛋白质组衰老时钟的重叠

 

 

 文章小结

血浆蛋白质组学是检测生物年龄的有力工具,可用于量化人群中最常见的年龄相关疾病有关的生物衰老特征。蛋白质组学衰老时钟可以用作识别与多发疾病有关的生物学机制的可靠工具,并且可以作为识别蛋白质靶标的有用工具,指导潜在的药物治疗或生活方式干预,以降低过早死亡,减少或延缓主要年龄相关疾病和多发性疾病的发生。

 

 

中科优品推荐

【中科新生命】现推出Olink蛋白质组产品,基于专利PEA技术,突破性实现血液样本超敏微量分析。结合DIA血液蛋白质组强强联合,形成肿瘤免疫,心血管,肠道微生物等多领域全方位解决方案,欢迎感兴趣的老师前来咨询。

滑动图片查看更多>>>