学术动态
当前位置: 首页 > 学术动态 > 正文

Nature Communications | 实验室程炜/冯建峰团队联合华山医院构建首个基于蛋白质组学的多疾病风险预测模型

时间:2023-11-30    浏览次数:


蛋白质是生命过程中的重要执行者,从酶的催化到免疫的调控,都离不开蛋白质的参与。高通量蛋白质测序技术的发展为生物医学和临床研究提供了全新的视角和丰富的数据,进一步与人工智能算法的交叉融合,为解析疾病发生发展机制以及临床诊疗实践提供前所未有的契机。

近日,复旦大学类脑智能科学与技术研究院、计算神经科学与类脑智能教育部重点实验室程炜研究员/冯建峰教授团队与复旦大学附属华山医院郁金泰教授团队展开联合攻关,基于血浆蛋白质组学数据和人工智能算法研发了全新的蛋白风险评分,实现对未来多种疾病及死亡等重大健康结局的预测,并验证其在临床应用中的价值。研究结果支持血浆蛋白质组学数据的广阔应用前景,对疾病早期预警与精准防控具有重要意义。

2B1AB

当地时间20231128日,相关研究成果以《血浆蛋白质组学数据预测未来健康风险》(Plasma proteomic profiles predict individual future health risk)为题发表于《自然·通讯杂志》(Nature Communications)。

6BC18

1:课题研究思路

研究团队基于英国生物样本库(UK Biobank)队列数据,对其45种常见疾病及死亡进行了中位数时长超14年的追踪随访。其中45种结局涵盖国际疾病分类第十版中的(International Classification of Disease 10th Revision, ICD-10)全因死亡和全部系统性疾病,包括感染性、血液、内分泌、精神、神经、感官、循环、呼吸、消化、皮肤、肌肉骨骼、泌尿生殖和癌症等重大健康结局。研究采用迄今为止全球最大的蛋白质组学数据(52,006被试),通过对OLINK平台检测的1,461种血浆蛋白质测序数据进行建模分析,开发了一款全新的基于神经网络的蛋白风险评分(Proteomic Risk Score, ProRS),该评分对呼吸系统疾病、循环系统疾病、糖尿病、肺癌、前列腺癌预测效能超85%,对全因死亡、痴呆、肾衰竭、肥胖、慢性肺栓塞预测效能超80%


本研究共同通讯作者,复旦大学附属华山医院郁金泰教授表示:既往针对蛋白质组学的研究往往聚焦于研究人员各自感兴趣的某类疾病,且更多局限于小样本横断面的病例-对照研究;本研究首次采用超5万例个体的血浆蛋白质数据并探究其对多种纵向健康终点事件的预测效用,是一项开创性的工作。

2BD51

2ProRS对各疾病及死亡的关联散点图和风险分层图

研究团队发现,高水平ProRS个体相较于低水平个体,其所有系统性疾病的发生率和全因死亡率均显著升高,且ProRS与年龄和性别显著相关。将ProRS三等分把人群划分为高、中、低ProRS人群后,可观测到高ProRS人群,其 16种疾病和4种特定原因死亡的发生率较低ProRS人群增加超过5倍,特别是在呼吸系统以及循环系统引起的死亡、痴呆、糖尿病和肥胖中,其风险超过20倍。这表明ProRS和整体健康密切相关。

64DD7

3ProRS对比不同预测因子组合

研究还深入探讨了ProRS的预测能力。单独使用ProRS预测时,Cox比例风险回归模型在10个结局中得到的Harrell C 指数超过0.8。在绝大部分结局中,单独ProRS的预测表现较常用的三组预测因子相当或更好,包括年龄+性别、血清指标(SERUM,25个指标)或临床因子组合(PANEL,54个指标);且在一部分结局中,单独ProRS的表现显著优于血清指标和ProRS的组合,说明ProRS包含有更丰富的预测信息。

33964

4ProRS的校准曲线和决策曲线

进一步,研究评估了预测模型的临床效用,采用了模型校准和决策曲线分析。不同预测指标组合都显示出良好的校准。在决策曲线分析中,和常用的两组预测因子相比(年龄+性别、临床因子组合),仅基于ProRS的模型在大多数疾病中显示出更大的净效益。在常用的两组预测因子基础上,添加ProRS可以显著观测到临床效用的提升,且与单独使用ProRS表现相近。在特定的决策阈值范围内,ProRS甚至比不同预测因子组合表现出更高的净效益,说明ProRS的具有较好的临床应用潜在价值。

本研究的结果非常令人兴奋,我们发现蛋白质组学数据可以对多种疾病和死亡风险具有很好的预测效能,并且在相当一部分疾病中蛋白质的预测表现显著优于既往临床预测指标。这一结果证明蛋白质组学是未来精准医疗的绝佳切入点,让人对其未来的应用前景充满希望,一滴血预测未来疾病风险或将真的实现。本研究的共同通讯作者,程炜研究员表示。

82AAE

5:蛋白在系统性健康疾病预测中的作用

最后,研究团队还通过夏普值(SAHP value)对血浆蛋白重要度进行排序,结果表明一些蛋白质在预测多种系统疾病及死亡结局中都发挥着至关重要的作用。例如,在对所有系统疾病以及全因死亡的预测中,GDF15的重要度都位居前1%。此外CDCP1CXCL17EDA2R HAVCR1 在超过10个系统疾病中也均表现出重要的预测价值。随后,研究团队重点展示了癌症和痴呆两种备受关注的疾病。以癌症为例,较高的血浆CXCL14GDF15HAVCR1CDCP1TSPAN1LTBP2 ACTA2 可能会导致癌症风险升高,而较高的血浆RET水平显示出保护作用。对于痴呆,NEFLBCANGFAPGDF15是影响疾病风险的主要蛋白质,ACTA2LTBP2NCS1是新发现的与痴呆风险相关的重要蛋白。这些标志物为疾病早期识别和治疗干预提供了新的潜在靶点,也为临床实验和研究提供新的方向。

冯建峰教授表示:本研究中发现的重要蛋白对相关疾病的预防策略和治疗措施提供了重要靶点。未来课题组将聚焦于如阿尔茨海默病、帕金森病、抑郁、焦虑等与脑相关的重大疾病,进一步围绕蛋白质组学数据与神经精神疾病的关系开展研究,发掘新的蛋白标志物并探究其内在机制,为脑疾病早期诊断、预测和进展评估奠定理论基础。

此外,冯建峰教授补充道:研究院也在积极推动脑体检项目,希望将多年积累的脑科学研究成果应用到老百姓体检中;相信不远的将来,大家都可以享受到国家对于我们科研投入带来的回报。

复旦大学类脑智能科学与技术研究院、计算神经科学与类脑智能教育部重点实验室博士后尤佳、复旦大学附属华山医院博士生郭钰张一为共同第一作者。复旦大学类脑智能科学与技术研究院、计算神经科学与类脑智能教育部重点实验室冯建峰教授、程炜研究员。复旦大学附属华山医院郁金泰教授为论文共同通讯作者。该研究得到了科技创新2030“脑科学与类脑研究重大项目、国家自然科学基金、国家重点研发计划、上海市市级科技重大专项等经费支持。

原文链接:

https://www.nature.com/articles/s41467-023-43575-7


相关代码:

https://github.com/jasonHKU0907/FutureHealthProteomicPrediction