微生物研究中除了物种丰度,还能从哪些角度筛选关键菌群?
在上篇文章(“肠-靶轴”研究如何突破套路瓶颈?从临床到机制,挖掘关键肠道菌群!)中,我们主要介绍了从“物种丰度”角度,利用单菌的丰度变化筛选在不同样本存在显著差异表达的菌群,或使用“物种共现网络图“,描绘物种间的潜在互作关系,并根据网络内每个节点(物种)的连通性等筛选优势物种。
除物种丰度外,还能从哪些其它方法中挖掘关键菌群呢?“肠-靶轴”研究,数据挖掘第二弹→从功能基因入手,将物种和功能基因进行关联,挖掘关键菌群具备的潜在功能,为后续解析肠道菌群如何调控靶器官奠定基础,甚至可直接确定靶器官的组学选择。对于宏基因组数据,由于检测的是肠道中所有微生物的DNA信息,因此还可进行binning分析,将来自同一菌株的序列聚集到一起,得到一个菌株的基因组,获得从而构建微生物组的参考基因集。这种方法不仅可扩充人类肠道微生物的已知物种数据库,为宿主与微生物互作研究提供了基因库,也为挖掘新物种和预测新物种功能奠定基础。
接下来就一起看看文章中都会有哪些分析点~
1. 功能基因注释
了解基因是什么以及可以发挥什么功能是“功能基因注释“首要解决的问题。常言道“序列决定结构,结构决定功能”。利用reads序列信息或binning分析中的bin与多个功能数据库进行比对,从而得到每个样本中“基因”的功能注释信息。
表1 “肠-靶”轴研究中常见功能基因数据库
在一项他汀类药物治疗高血糖的研究中,研究者先通过非靶代谢组发现随治疗时间延长,胆汁酸生物合成途径受到显著调控,表现为鹅去氧胆酸(CDCA)丰度增加,熊去氧胆酸(UDCA)丰度下降。宏基因组结果表明,服用他汀药物后,梭状芽胞杆菌属丰度下降,结合代谢组数据进行相关性分析,梭状芽孢杆菌属与胆汁酸代谢的相关性最强。先前研究发现梭状芽孢杆菌属(Clostridium)的多个物种介导HSDH通路,利用KEGG功能注释寻找与肠道菌群次生胆汁酸代谢相关的功能途径,发现7-α-HSDH(K00076,CDCA到UDCA转化至关重要的酶的同源基因)以时间依赖性的方式减少。得出他汀类药物可能诱导富含梭状芽孢杆菌的微生物群减少,表达CDCA向UDCA转化的基因 [1]。
图1 KEGG数据库中K00076在他汀药物治疗0,1,4,16周的丰度水平
2. 功能基因丰度差异分析,筛选差异表达的代谢途径
比对完成后,可从比对结果统计不同功能层级的相对丰度。随后,从功能注释结果及基因丰度表出发,获得各个样品在各个分类层级上的基因数目表,对于某个功能在样本中的基因数目,等于在注释为该功能的基因中,丰度不为0的基因数目。该结果可与代谢组数据进行相互验证,从代谢层面验证菌群调控是否产生对应结果。
利用差异丰度分析,鉴定出162个在正常和IBD患者之间差异表达的KO基因,主要为编码代谢酶基因,特别是涉及氨基酸和其他代谢的基因,表明肠道微生物群与其代谢活动之间密切相关。对基因进行富集分析,发现 “细胞周期”、“双组分系统”、“脂多糖生物合成”、“氨基酰基-tRNA生物合成”4条通路呈现上调模式。其中,双组分系统在调节某些细菌的毒力因子中起关键作用。在双组分系统通路中,CRP(K10914, CRP/FNR家族转录调节因子)是变化最高的基因,暗示CRP可能潜在的作为一个关键的转录调节因子,促进肠道炎症的发生。此外,作者还观察到IBD中几种途径的下调,如丙酸代谢、磷酸转移酶系统(PTS)、苯乙烯降解、糖酵解/糖异生和氨基酸的生物合成[2]。
图2 热图展示162个在IBD中最显著富集的KO基因
3. 功能基因丰度LEfSe分析,筛选关键代谢途径
该分析同物种丰度LEfse分析,LEfSe分析原理可参考(“肠-靶轴”研究如何突破套路瓶颈?从临床到机制,挖掘关键肠道菌群!),在此不做过多赘述。利用功能基因丰度开展LEfSe分析,可以筛选到不同组间样本存在显著差异的代谢途径以及途径中的功能基因,为后续利用功能基因溯源菌群奠定基础。
4. 物种对功能基因贡献度分析
如上文所说,物种与功能之间存在对应关系,存在不同物种具备相同功能或同一物种具备不同潜在功能的情况。因此,通过物种对功能基因贡献度分析,可以找出特定功能的物种贡献度或者特定物种的功能贡献度。此分析旨在研究Top物种所具有的主要功能,并研究这些功能主要存在于哪些物种中。该方法可与“功能基因丰度LEfSe分析“联合使用,先通过LEfSe分析寻找关键代谢途径并明确途径中的功能基因,再利用贡献度分析,筛选对功能基因贡献度较大的物种。
下面这篇“肠道微生物衍生的氨调节宿主应激脆弱性”的研究中,研究者先通过生理实验、伪无菌小鼠模型、粪菌移植等方法,发现慢性社会失败应激(CSDS)暴露小鼠的粪便中,氨和细菌脲酶水平下降,暗示在应激条件下,局部肠道微生物的紊乱可能介导氨水平的降低。宏基因组功能基因丰度LEfSe分析表明,CSDS暴露小鼠脲酶相关途径下调表达(a)和较低的脲酶相关基因百分比(b,c)。整体结果表明,CSDS暴露降低了产脲酶微生物将尿素水解成氨的能力。研究者进一步评估了不同菌群对尿素降解的贡献。根据贡献的递减顺序,尿素被代谢为氨的细菌依次为:unclassified_f_Muribaculaceae、unclassified_o_Bacteroidales、Barnesiella、unclassified_d_Bacteria、unclassified_f_Lachnospiraceae、Cupriavidus、Lactobacillus、Helicobacter、Eubacterium和Muribaculum。其中,氨基酸代谢途径中含有尿素B的“unclassified_o_ Bacteroidales”在对照组中富集,氨基酸代谢途径中含有尿素A的“unclassified_f_Lachnospiraceae”在CSDS组中富集[3]。
图3 被CSDS改变的肠道脲酶阳性细菌诱导抑郁性行为
5. 功能基因丰度-物种丰度共现网络分析
除了通过物种丰度来分析并单独计算物种-物种共现网络以寻找核心位置的菌群外,还可以构建物种丰度与功能基因丰度的共现网络,以挖掘与功能基因显著相关的物种。
在一项探索腹主动脉瘤(AAA)形成机制的研究中,宏基因组数据经过KEGG注释后,发现AAA患者肠道菌群功能和KEGG代谢途径与健康个体明显不同。其中,色氨酸代谢、脂多糖生物合成等在AAA患者中富集,脂肪酸生物合成和谷胱甘肽代谢在健康个体中富集(图4A)。说明AAA患者和健康人群中肠道菌群存不同的代谢模式。进一步借助功能基因与肠道细菌的共现网络分析,发现Klebsiella spp.(克雷伯氏菌)和Enterobacter spp. (肠杆菌)与脂多糖(LPS)合成中编码关键酶的多种基因存在显著正相关性,而R. intestinalis(罗斯拜瑞氏菌)与这些基因呈显著负相关(图4B)。同时,R. intestinalis与丁酸生产中的关键酶(如磷酸丁酰转移酶(K00634))呈显著正相关, R. intestinalis上清液靶向短链脂肪酸检测证实该菌具备合成丁酸的能力。后续利用非靶向代谢组再次验证得出R. intestinalis可能通过产生进入循环的丁酸来抑制AAA的发展。为下游“菌群→代谢物→靶器官响应”研究提供方向[4]。
图4 项目文章:肠道细菌与KO基因的相关性网络发现R. intestinalis与脂多糖合成相关基因显著负相关
表2 肠道菌群功能基因挖掘策略汇总
在下期软文中,我们将结合其它组学数据(如转录组、蛋白质组、代谢组等),或临床表型指标,持续探讨在临床“肠-靶轴”队列中如何有效挖掘关键数据~。同时,我们还整理了当下临床“肠-靶轴”研究的热点解决方案,想要提前了解的老师快联系当地中科新生命销售~
[1] She J, Tuerhongjiang G, Guo M, et al. Statins aggravate insulin resistance through reduced blood glucagon-like peptide-1 levels in a microbiota-dependent manner. Cell Metab. 2024 Feb 6;36(2):408-421.e5.
[2] Ning L, Zhou YL, Sun H, et al. Microbiome and metabolome features in inflammatory bowel disease via multi-omics integration analyses across cohorts. Nat Commun. 2023 Nov 6;14(1):7135.
[3] Wang P, Wu PF, Wang HJ, et al. Gut microbiome-derived ammonia modulates stress vulnerability in the host. Nat Metab. 2023 Nov;5(11):1986-2001.
[4] Tian Z, Zhang Y, Zheng Z, et al. Gut microbiome dysbiosis contributes to abdominal aortic aneurysm by promoting neutrophil extracellular trap formation. Cell Host Microbe. 2022 Oct 12;30(10):1450-1463.e8.
中科优品推荐
【中科新生命】“肠-靶器官”轴研究对解析肿瘤发生、药靶挖掘、治疗疗程、预后评估的重要性不言而喻,中科新生命以宏基因组&16s扩增子测序为基础,结合Bulk转录组、Bulk蛋白质组、修饰组、Bulk代谢组及脂质组等核心产品,还可延展时空多组学平台(单细胞转录组、空间转录组、空间蛋白质组、空间代谢组),开展横向队列和纵向队列的多种研究方案,为肿瘤治疗前响应预测,治疗的分子机制、窗口期响应预测等提供个性化解决方案,为您的研究保驾护航!