新闻资讯

挖掘微生物与代谢物/蛋白质/基因间的潜在互作关系,看这篇文章就够了!

2024-09-13
中科新生命
741

上期文章(链接:微生物研究中除了物种丰度,还能从哪些角度筛选关键菌群?)中,我们聚焦菌群丰度和功能基因挖掘到关键候选菌群。如果只是测了宏基因组,关注微生物变化的老师,自此数据挖掘部分可暂告段落。但若还有其它组学数据或表型数据,想和微生物变化进行关联分析,则不可错过今天跟大家分享的内容。

今天,我们将重点探讨菌群多组学研究,整理在物种关联分析中常用的分析点,包括每个分析点所需的数据以及它们如何帮助解答生物学问题。由于组学关联的方式多样,如“宏基因组+转录组”或“宏基因组+蛋白质组”,我们将以“肠-靶轴”研究中应用最广泛的“宏基因组+代谢组”为基础进行整理,其中代谢组包括非靶代谢组、靶向代谢组和脂质组 各类数据。

 

 

 

1. 环境因子分析

 

Distance-based redundancy analysis(dbRDA),又称为微生物环境因子分析,是一种约束性排序方法,与大家熟知的CCA(典范对应分析)、RDA(冗余分析)原理较为类似。差别在于CCA或RDA在物种降维过程中以欧式距离排序为基础获得样本排序坐标,dbRDA则关注任何距离矩阵物种(例如Bray-curtis距离等)关系的RDA。得出代谢物A(或基因A、蛋白质A等)对微生物群落组成的影响最大的候选结论。后续机制探索中,可聚焦哪些因素调节了A,进而影响肠道菌群组成。

下面这篇产前地塞米松暴露(PDE)对后代肠道菌群和疾病易感性的临床+机制研究中, dbRDA分析表明结肠粘蛋白合成基因(Muc2)在解释肠道菌群变异方面优于其它基因。机制上表现为:PDE通过表观修饰抑制肠道杯状细胞中Muc2的表达,进而改变肠道微环境,影响肠道微生物群的定植和组成[1]

图1 dbRDA分析表明Muc2丰度在解释肠道菌群变异方面优于其他功能基因

 

Tisp:dbRDA结果图形解读:以图1(B,I为例)dbRDA1,dbRDA2为约束轴,不同颜色圆点表示不同分组样本。组内样本越聚拢说明样本间距离越短,样本中物种的相似性越大。箭头为转录组中的功能基因,箭头距离原点越远说明对物种的影响越大,因此得出Muc2为关键候选基因,对肠道菌群影响最大

圆点和箭头的关系主要分为三种:

① 圆点对箭头所在直线做垂线(下图2a),相比于垂点落在直线的反向延长线上(ii’),垂点落在直线上(i’)说明基因1在样本i中的含量更高;

② 基因1和基因2(下图2b)之间的夹角大小表示两者的相关性,夹角为锐角且越小时,两基因之间为正相关且相关性高(∠b);夹角为钝角且越大时,说明两基因之间为负相关且相关性高(∠c);夹角为直角,则两基因之间无相关性(∠a);

③ 基因与约束轴的垂线得到的垂点,距离原点越远说明对约束轴的贡献度越大,如图2b中,基因2垂向RDA2轴得到的垂点2’比基因1的垂点1’离原点更远,说明基因2对RDA2的贡献度更大[2]

图2 db RDA结果可视化

 

 

 

2. 功能通路分析

聚焦KEGG数据库https://www.kegg.jp/),基于数据库中收录的代谢途径进行组学关联。常用关联逻辑为:

① 先利用其它组学等得到的关键分子(如基因、蛋白质、代谢物等),对其进行KEGG富集分析,明确这些关键分子主要富集到的代谢途径;

② 对宏基因组数据进行KEGG功能注释得到功能基因;

③ 将①中得到的代谢途径与②中得到的功能基因进行关联,锁定落在代谢途径中的功能基因;

④ 利用物种贡献度分析,筛选③中功能基因贡献度最大的物种。由此,可初步得出“物种A和代谢物B可能共同调节代谢途径C,进而调控疾病发生”的候选结论。

下图是一篇中科新生命客户文章,利用宏基因组和代谢组探索肠道菌群影响动脉粥样硬化发展的临床性研究。作者借助KEGG数据库对宏基因组基因片段和代谢物富集到的代谢途径进行关联,发现微生物群可以参与肠道代谢途径,两者共同影响氨基酸代谢和维生素代谢[3]

图3 CAD相关的肠道微生物功能变化及其代谢组学关联

(中科新生命项目文章解读链接:项目文章Cell Commun Signal | 新疆医科大学团队揭示单菌也有大功效:普拉梭菌可抗动脉粥样硬化)

 

 

 

3. 相关性分析

 

相关性分析是组学关联中最常见的关联手段,无论是“转录组+代谢组”、“宏基因组+代谢组”、“表型指标+代谢组”等均可使用此方法,其原理不再过多赘述。微生物组学研究中,常借助Spearman判定两者是否相关,并认为|相关系数|处在0.8~1,p<0.05为极强相关。因此,在筛选关键数据时可优先聚焦大于0.8以上的关系对。如筛选不出预期的关系对,则可将阈值放宽至>0.6,不建议在0.6以下。

图4 母乳中岩藻糖和3-氨基壬-5-烯酸与肠道微生物群呈正相关,暗示母乳代谢物会影响肠道微生物,与特应性皮炎(AD)有关[4]

(中科新生命项目文章解读链接:项目文章Gut | 佛山市第一人民医院团队从临床到机制揭示婴儿肠道失调与特应性皮炎关联)

 

 

 

4. Mantel test分析

 

相比于上述(3)中的Spearman或Pearson处理两列数据之间的相关性(如计算物种A与代谢物B在所有样本中丰度变化关系)。Mantel test聚焦于处理两个矩阵数据间的相关性,主要评估一个矩阵中样本之间距离的增加(或减少),另一矩阵中对应样本之间的距离也增加(或减少)。在实际计算时,往往先计算物种和代谢物(基因/蛋白质/数值型表型)矩阵的各自距离,得到两个距离矩阵,随后在利用Spearman或Pearson计算两个距离矩阵的相关性,从而获得哪些肠道菌群与代谢物丰度变化存在强相关。后续机制挖掘时,可聚焦这些物种和代谢物进行研究。若在研究前已有关注的代谢物,该策略可快速锁定与目标代谢物关联较强的物种。

 

 

 

5. mmvec分析

 

microbe-metabolite vectors,简称神经网络算法。使用配对的多组学数据(微生物序列计数和代谢物丰度)来计算,在存在特定微生物的情况下观察到代谢物的条件概率(共现率),以预测微生物与代谢物是否存在互作关系,尤其在已有目标代谢物时,快速推断出关键物种。在机制挖掘部分可阐述其发生的原因(目标代谢物由特定物种产生or特定物种可在目标代谢物所处微环境中存活等)。下图是一组炎症性肠病(IBD)中微生物-代谢物的相互作用研究,已知IBD患者中肉毒碱和胆汁酸水平失调,使用mmvec分析发现,Roseburia hominis与多种具有抗炎特性的肉毒碱共现(图5a)。克雷伯氏菌(Klebsiella spp.)与几种胆汁酸共同发生的概率很高(图5b),随后发现克雷伯氏菌与IBD状态存在高度相关性。由于克雷伯氏菌并不直接产生胆汁酸,则初步推测共现原因为克雷伯氏菌可在IBD患者中的高胆汁酸环境中存活,为后续研究奠定基础[5]

图5 与IBD样本相关的人类微生物组的微生物-代谢物相互作用

 

 

 

6. MIMOSA2分析

 

该方法通过预测微生物群落代谢能力---CMP(community-wide metabolite potential)构建一个代谢模型来预测群落组成对指定代谢物浓度的影响。MIMOSA2有一个数据库,包含物种及其对应的代谢能力信息。分析时,利用测序得到的微生物组数据并结合MIMOSA2数据库构建代谢模型,计算不同微生物对不同代谢物的CMP。随后,对每种代谢产物全部潜在贡献微生物CMP值进行汇总并做回归分析,评估微生物群落对代谢物的预测能力,最终筛选出对特定代谢物影响最大的微生物作为关键微生物。可在线完成MIMOSA2分析MIMOSA2 | MIMOSA2shiny (borenstein-lab.github.io) [6]

下面这篇慢性阻塞性肺疾病中气道微生物组功能特征的研究中,作者先利用Spearman筛选到一批具有强相关性的“微生物-代谢物-宿主基因靶标”关系对(图6d),随后对具有最强关联性的关系对进行MOMOSA2分析,发现链球菌属(Streptococcus)、梭杆菌属(Fusobacterium)、罗斯氏菌属(Rothia)分别是丁酸盐(Butyrate)-SOD2、同型半胱氨酸-MMP9 和棕榈酸酯-ACSL1的主要微生物贡献者(图6e)[7]

图6 慢性阻塞性肺疾病中气道微生物组研究

 

 

 

7. 肠道菌群孟德尔随机化(GM-MR)分析

 

Gut Microbiota Mendelian Randomization,即肠道菌群孟德尔随机化。临床中往往存在大量混杂因素干扰研究结论,GM-MR则可规避上述混杂因素对结果的干扰,从而得出更加精确的物种-疾病因果关系。借助遗传变异与肠道菌群物种组学或代谢产物的相关性,间接推断疾病与肠道菌群之间因果关联的分析方法。通过该分析可得出物种A与某一表型(疾病)具有因果关系的候选结论,不仅有助于挖掘肠道菌群标志物,也为肠道菌群如何调控靶器官发育或病变机制研究奠定基础。

下面这篇肠-眼轴的临床研究,作者从GWAS目录下载肠道微生物群的公开GWAS数据用作暴露数据,FinnGen研究中公开的近视GWAS的统计数据作为结果数据。使用逆方差加权(IVW)方法,鉴定出14种细菌与近视具有显著因果关系。特别是g_AKKermansia,为近视的保护因素(OR = 0.797,95% CI = 0.637–0.997,P = 0.047)。同时,在独立队列中发现AKKermansia与眼睛轴长呈负相关。后续在动物模型实验中,发现Akkermansia丰度与血浆中吲哚衍生代谢物3-IAA丰度变化存在正相关,提示Akkermansia可能在调节3-IAA水平上发挥关键作用,进而影响眼睛轴长[8]

表1 双样本孟德尔随机化探索近视与肠道菌群之间的因果关系

今天分享的内容已整理汇总在表2,便于大家集中查看。

表2 微生物多组学数据挖掘常用策略及可推测的生物学问题

常言道“纸上得来终觉浅,绝知此事要躬行”,想要完整深入开展“肠道微生物-靶器官互作”研究绝非几篇数据挖掘的文章就能解决。样本选择、组学搭配、验证方案、模型构建等等都是一座座大山,想系统开展此类研究,快联系当地中科新生命销售!我们会从“课题设计→样本提取→组学检测→数据挖掘→生物验证”每个阶段均提供专业团队,辅助您开展个性化的研究。中科新生命“微生物组+代谢组”开学限时特价,快来咨询吧!

 

 

参考文献及网站

[1] Lu X, Chen B, Xu D, et al. Epigenetic programming mediates abnormal gut microbiota and disease susceptibility in offspring with prenatal dexamethasone exposure[J].Cell Rep Med. 2024 Feb 20;5(2):101398.

[2] https://www.omicsclass.com/article/1353.

[3] Yang HT, Jiang ZH, Yang Y, et al. Faecalibacterium prausnitzii as a potential Antiatherosclerotic microbe[J]. Cell Commun Signal. 2024 Jan 19;22(1):54.

[4] Jiang S, Cai M, Li D, et al. Association of breast milk-derived arachidonic acid-induced infant gut dysbiosis with the onset of atopic dermatitis[J]. Gut. 2024 Jul 30:gutjnl-2024-332407.

[5] Morton JT, Aksenov AA, Nothias LF, et al. Learning representations of microbe-metabolite interactions[J]. Nat Methods. 2019 Dec;16(12):1306-1314.

[6] https://borenstein-lab.github.io/MIMOSA2shiny/.

[7] Wang Z, Yang Y, Yan Z, et al. Multi-omic meta-analysis identifies functional signatures of airway microbiome in chronic obstructive pulmonary disease[J]. ISME J. 2020 Nov;14(11):2748-2765.

[8] Li H, Du Y, Cheng K, et al. Gut microbiota-derived indole-3-acetic acid suppresses high myopia progression by promoting type I collagen synthesis[J]. Cell Discov. 2024 Aug 27;10(1):89.

 

 

中科优品推荐

科研无价,优惠有期,开学大“放价”!【中科新生命】蛋白、修饰、代谢、空间、单细胞、微生物组等各类产品纷纷优惠来袭,多产品花式联合“助研有术”,中科新生命果然还是太全面了!