新闻资讯

“肠-靶轴”研究如何突破套路瓶颈?从临床到机制,挖掘关键肠道菌群!

2024-07-11
中科新生命
973

 

在上期文章中,我们说到通过“肠-靶轴”研究可深入解析肠道菌群对靶器官的发育、疾病发生、疾病治疗的影响(深度“拿捏”微生物-宿主互作机制,文章level更上层楼)。产生这一现象的本质原因为:在外界环境干预下,肠道菌群的差异组成会分泌差异代谢产物,产物进入循环系统后,随着体液至不同靶器官,随之靶器官出现不同的响应,导致疾病的发生。由此,肠-靶轴研究可有个“套路”性的基础框架(图1)。

图1  “肠-靶轴“研究常见思路

 

 

 

 

在“肠-靶轴”研究不断深入成熟的背景下,如何突破套路瓶颈?从临床出发,落脚到机制研究,不失为一个好的切入点(图2)。该方案常用思路多为先通过临床数据挖掘在不同队列中表达特征存在显著“差异”的关键菌群,随后通过小鼠模型、细胞实验、类器官培养,分析关键菌群饲养/缺失是否会影响模型样本的特定表型,并对模型样本开展其它组学研究探索肠道菌群对靶器官的调控机制。因此,关键菌群or物种挖掘是从临床结果转化到机制研究的第一步。今天,小编汇总了多种关键菌群的挖掘思路,希望给各位研究者带来一些灵感。

图2 从临床到机制的“肠-靶轴”研究好文

 

 

01. 基于菌群丰度的挖掘策略

STRATEGY

1.1

LEfSe分析(LDA Effect Size)

主要目的是寻找在两组、多个分组或者同一分组内部亚组之间显著差异的物种。通过LefSe分析,不仅可以得到不同组中的丰度显著差异物种,还可获得这些物种的所有亚种是否趋于同一分类级别,彼此间是否存在进化关系。同时,LEfSe分析中,物种的LDA系数描述显著差异物种的影响程度(LDA系数越大,影响程度越高)。最终,综合物种丰度差异显著性和LDA系数筛选出潜在关键物种。下面这篇葛根素(PU)治疗动脉粥样硬化的研究中,通过LEfSe分析发现,相比于PU未处理组,PU处理组可改变肠道微生物组成,尤其减少普雷沃氏菌(Prevotella copriP.copri)的丰度。随后借助Spearman相关分析揭示P.copri与血浆三甲胺-N-氧化物(TMAO)水平呈正相关。后续通过单菌离体培养、单菌定植等实验探索PU通过P. copri改善动脉粥样硬化的具体作用机制并验证[1]

图3 项目文章:LEfSe分析在PU处理组和未处理组中丰度显著差异表达的关键物种

注:图中展示了LDA评分超过预设阈值(≥2)的生物标志物。图中柱子颜色表示不同样本组。柱子长度为LDA评分值,用于描述不同组间显著差异物种的影响程度。

 

1.2

差异分析

差异分析指直接利用物种丰度进行两组双侧T检验、双侧Wilcoxon检验或多组方差分析(ANOVA)寻找在不同组中丰富显著差异的物种。在一项结直肠癌(CRC)的研究中,利用差异分析发现麦芽香肉杆菌C.Maltaromaticum)在CRC粪便样本以女性特性方式耗尽,该现象在男性CRC患者中并未观察到。同时该结果在癌症基因组图谱(TCGA)队列中,女性CRC患者的麦芽香肉杆菌丰度预后表现也比男性更突出。后续聚焦于C.Maltaromaticum,挖掘该菌抑制雌性小鼠结直肠癌的机制研究[2]

图4 与男性相比,女性CRC患者中C.Maltaromaticum丰度大幅减少

 

1.3

多变量Cox分析(multivariate, MV Cox)

比例风险回归模型,主要用于评估物种对于预后影响,或者判断是否是独立预后因素。在临床队列研究中,控制其它因素后,使用该方案判别目标物种对患者生存时间的影响是否仍然是显著的。一般在进行多因素Cox回归前,会先进行单因素Cox回归对每个变量逐个进行分析,将有意义的单因素纳入到多因素中进行分析。如下面这篇宫颈癌的研究中,利用多因素Cox发现乳杆菌(Lactobacillus iners)是无复发生存和总生存期差的独立预测因子,与患者生存率降低有关。在后续研究中,进一步解析发现L.iners可改变乳酸信号通路中的基因表达,诱导宫颈癌细胞的化疗和放疗耐药性,并导致肿瘤代谢重塑[3]

图5 Kaplan-Meier无复发生存期(RFS)曲线按肿瘤乳杆菌的存在(n=44)或不存在(n=52)分层(左),总生存期 (OS) 的多变量 Cox 比例风险分析,调整肠道微生物组多样性和肿瘤L. iners

 

1.4

MaAsLin2

多变量线性回归模型(Multivariate Analysis by Linear Models),使用广义线性和混合模型以适应各种流行病学研究。队列研究中,参与者肠道菌群不仅与疾病有关,还受到生活方式、性别、环境等多种因素影响。该方法不仅可以排除上述混杂因素对研究目标的干扰,使分析结果更准确。还可根据临床数据与菌群的相关性确定与特定临床表型显著关联的菌群。对混杂因素较多的临床研究具有更好的数据挖掘效果。下面这篇关于产前地塞米松治疗(PDT)对婴儿肠道微生物组成及疾病易感性的研究中,调整潜在混杂因素(如母亲年龄、胎龄、分娩方式、喂养类型、抗生素和益生菌暴露)后,利用MaAsLin2分析,在属水平发现PDT女婴中13个细菌属相对丰度下降,11个细菌属增加。PDT男婴中8个细菌属减少,9个细菌属增加;在种水平发现Akkermansia muciniphila和一些胆汁酸代谢细菌在PDT女婴中显著减少。表明,PDT治疗导致婴儿肠道微生物群发生显著的群落和分类学改变,并存在性别差异。 

图6 在雌性和雄性婴儿中通过MaAsLin2调整其他混杂因素后,与PDT相关的物种[4]

 

1.5

随机森林

在临床队列中,关键物种往往具备分类潜能,即能将健康者-患病者,不同患病人群区分开,又被称为biomarker。随机森林可通过建“树”的方式挖掘到这些潜在biomarker。其基本原理为:先构建多棵决策树形成“森林”,一棵决策树为一个分类器(分类器根据物种信息将输入样本进行分类)。同时,在构建决策树时,每棵树有放回的随机选择样本并随机选择物种以提高“森林”的稳定性,一定程度避免过拟合。“森林”构建完成后,由于每棵树都是一个分类器,那么对于一个输入样本,N棵树会有N个分类结果。随机森林集成所有分类投票结果,将投票次数最多的物种作为最终的输出。因集成所有分类投票结果,因此随机森林是一种Bagging算法,无需降维处理,直接开展高纬度数据分析,适合并行计算。

图7 项目文章利用随机森林分类器,将长双歧杆菌(BL)确定为术后肝功能正常恢复(NR)和延迟恢复(DR)分类的最重要贡献者[5]

 

1.6

物种共丰度网络

丰度差异分析往往聚焦于高丰度物种并将其作为用于区分宿主健康和疾病状态的biomarker。而肠道菌群中共同生活的物种,它们之间相互关联的综合作用在调节靶器官健康中也扮演极重要的角色,部分低丰度物种可能通过改变其它物种的交流方式,进而扰乱宿主肠道菌群平衡状态,诱导疾病发生。同时,当两个物种在同一环境中存在较强相关性,往往意味着这两个物种具有一定的生态位重叠。并且,根据相关关系可将物种划分多个模块,模块内是存在高度相关性的物种,可能反应物种的共进化。因此,识别由不同但合作的物种组成的“集群”或“亚群落”,分析集群驱动网络变化的关键物种也是队列研究中常见的挖掘策略。

 

1.6.1 相关性网络

相关性分析是整体性解释不同物种之间变动关联程度的指标,用相关系数对变动关联程度进行度量,用以发现关键物种或互作关系对。其中,相关系数绝对值越大,物种之间的变动关联程度越强。常用的相关性分析算法为:

① Spearman相关性:用于揭示两个feature的秩次大小作相关分析,对原始变量的分布不作要求,也无线性相关要求;

② Pearson相关性:用于评估feature之间线性相关程度。当标准差为0时,无法使用该方法;

③ Kendall相关性:又称肯德尔秩相关系数,也是一种秩相关系数,其计算对象是分类有序/等级变量,如质丰度等级,指标等级等;

最后通过网络图、桑基图、折线图等形式描述结果。

在腹主动脉瘤(AAA)形成研究中,发现R. intestinalis在AAA患者中丰度显著降低。利用Spearman相关性发现R. intestinalis与丁酸生产中的关键酶呈显著正相关,表明R. intestinalis存在合成丁酸能力。同时该菌与许多肠道菌群代谢物密切相关。因此,后续则聚焦R. intestinalis菌株开展研究,发现R. intestinalis及其代谢物丁酸可在宿主体内抑制中性粒细胞浸润和中性粒细胞胞外陷阱(net)形成,改善AAA[6]

图8 身体四个部位来源的微生物项目文章Spearman相关性挖掘影响腹主动脉瘤中性粒细胞胞外陷阱形成的关键菌群组的纵向描述

 

1.6.2 SparCC网络

在微生物组数据中,当群落多样性或组成性较低时,直接利用Pearson或Spearman方法建立物种共生网络往往存在与真实情况相违背的错误关系,常出现负相关偏多,正相关被抑制的情况。其本质原因是物种丰度或基因丰度存在很多零值,整体数据为一个“高稀疏性矩阵”。SparCC分析时,从测序序列条数出发,先将序列条数数据取对数转化后,以消除正相关被抑制问题,然后基于Pearson线性原理,结合方差计算相关系数(-1到1),最后基于置换检验获得相关性P值,并用网络形式展示结果。图中,节点大小代表物种的平均丰度(节点越大,丰度越高)。节点之间的线表示相关性,用不同颜色区分正相关或负相关。线宽度对应相关性大小[7]

图9 微生物相互作用网络显示高脂饮食后不同共丰集基团(CAG)之间的相互作用,发现CAG6,CAG18之间存在高度显著负相关。CAG18主要为Lachnospiraceae[8]

 

1.6.3 NetShift网络

通过引入邻节点转变分值(Neighbor Shift,NESH)来分析网络中临近节点的变异程度再结合节点数量来评估节点驱动性。该算法假定两个需要比较的分组网络A和B,通过计算两个网络共有、特有关系对,构建一个评价体系(X、Y、Z值),获得最终的NESH值,该值越大说明物种驱动性越强,该物种越有可能是驱动网络产生变异的推手。下面这篇研究直肠癌文章中,作者借助NetShift分析,发现拟杆菌属中几个物种表现出强大的相关性,并在化疗无反应组的生态网络中占据中心位置,表明其在网络中起着关键作用[9]

图10 粪便拟杆菌、卵形拟杆菌和马氏拟杆菌被确定为对放化疗无反应的直肠癌患者微生物组潜在驱动物种

 

1.6.4 MENA网络

Molecular Ecological Network Analysis通过基于随机矩阵理论(RMT)构建网络。相较于其它方法,该方法自动定义网络并对噪声具有鲁棒性。其分析过程可分为两个阶段:

步骤1:网络构建。包括数据收集→数据标准化→相似性矩阵计算→基于RMT方法确定邻接矩阵→绘制无向网络。

步骤2:网络分析。计算网络拓扑特征、模块检测、基于模块的特征物种分析等。除了分析物种间的相关性外,MENA还支持评估建立微生物网络特征与环境特征的关联。MENA在线分析链接(http://ieg4.rccc.ou.edu/MENA/);

 

 

02. 总结

SUMMARY

本文主要围绕丰度信息,梳理关键菌群的挖掘策略。在肠道研究中,无论是扩增子还是宏基因组测序都可适用。当然,如果为宏基因组,除上述策略外,还可利用物种功能挖掘数据。由于篇幅有限,这部分内容以及菌种与代谢物之间的潜在调控机制探索会在之后的文章中一一介绍。可持续关注中科新生命~

 

03. 参考文献

LITERATURE

[1] Ze-Hua L, Jun W, Jing Y, et al. Puerarin alleviates atherosclerosis via the inhibition of Prevotella copri and its trimethylamine production. Gut. 2024 Jun 10:gutjnl-2024-331880. doi:10.1136/gutjnl-2024-331880

[2] Li Q, Chan H, Liu WX, et al. Carnobacterium maltaromaticum boosts intestinal vitamin D production to suppress colorectal cancer in female mice. Cancer Cell. 2023 Aug 14;41(8):1450-1465.e8. doi:10.1016/j.ccell.2023.06.011

[3] Colbert LE, El Alam MB, Wang R, et al. Tumor-resident Lactobacillus iners confer chemoradiation resistance through lactate-induced metabolic rewiring. Cancer Cell. 2023 Nov 13;41(11):1945-1962.e11 doi:10.1016/j.ccell.2023.09.012

[4] Lu X, Chen B, Xu D, et al. Epigenetic programming mediates abnormal gut microbiota and disease susceptibility in offspring with prenatal dexamethasone exposure. Cell Rep Med. 2024 Feb 20;5(2):101398. doi:10.1016/j.chom.2023.11.011

[5] Yu J, Zhu P, Shi L, et al. Bifidobacterium longum promotes postoperative liver function recovery in patients with hepatocellular carcinoma. Cell Host Microbe. 2024 Jan 10;32(1):131-144.e6. doi:10.1016/j.chom.2022.09.004

[6] Tian Z, Zhang Y, Zheng Z, et al. Gut microbiome dysbiosis contributes to abdominal aortic aneurysm by promoting neutrophil extracellular trap formation. Cell Host Microbe. 2022 Oct 12;30(10):1450-1463.e8. doi:10.1371/journal.pcbi.1002687

[7] Friedman J, Alm EJ. Inferring correlation networks from genomic survey data. PLoS Comput Biol. 2012;8(9):e1002687. doi:10.1038/s41467-024-48611-8

[8] Wang P, Yang X, Zhang L, et al. Tlr9 deficiency in B cells leads to obesity by promoting inflammation and gut dysbiosis. Nat Commun. 2024 May 18;15(1):4232. doi:10.1016/j.ccell.2022.11.013

[9] Teng H, Wang Y, Sui X, et al. Gut microbiota-mediated nucleotide synthesis attenuates the response to neoadjuvant chemoradiotherapy in rectal cancer. Cancer Cell. 2023 Jan 9;41(1):124-138.e6. doi:10.1016/j.ccell.2022.11.013

 

 

中科优品推荐

【中科新生命】专业成熟的临床队列研究技术团队、项目丰富的临床数据处理生信人员、行业领先稳健的质谱检测平台、跨队列宏基因组生物样本库。为您深入解析多种队设计中肠道微生物群-靶器官互作机制研究提供有力保障!