组学服务
Research services
联系我们

021-54975031

021-54665263

整合分析

蛋白质组学与转录组学整合分析

蛋白质组学是指在大规模水平上研究蛋白质的特征,包括蛋白质表达水平、翻译后修饰、蛋白质相互作用等,由此获得蛋白质水平上的关于疾病发生、细胞代谢等过程的整体而全面的认识,目前常见的蛋白质组学技术有iTRAQ、Label free、SILAC、2D/DIGE等。

转录组学是一门在整体水平上研究细胞中基因转录的情况及转录调控规律的学科。常见的转录组学研究手段有表达谱芯片、转录组测序等。

蛋白质组学和转录组学都是系统地研究生物学规律和机制的成熟并且有效的工具,由于生命体是一个多层次、多功能的复杂结构体,所以单一组学技术不能全景地揭示生命活动的本质规律。采用蛋白质组学和转录组学技术同步检测蛋白质及RNA的整体状态,并且将这两个组学的数据整合起来分析,不仅能在蛋白质水平及转录水平两个不同层次上透视生命活动的规律与本质,还能揭示二者之间的相互调控作用或者关联。

目前将蛋白质组学与转录组学的数据整合分析已经成为一种趋势[1,2,3],具体优势主要体现在以下三个方面:

[1]      提升蛋白质组数据库质量

对于非模式生物来说,由于相关的研究非常少(公布的基因序列较少),其蛋白质序列数据库质量比较差。而蛋白质组学研究依赖于相关的蛋白质序列,因此对于这些物种来说蛋白质组学研究存在比较大的困难。采用转录组测序技术,拼接出这些物种的转录组并构建蛋白质序列数据库,可以大大提升蛋白质组学的鉴定数量和定性定量分析结果的准确性。

[2]      全面认识基因表达状态

基因表达不仅仅是转录组向蛋白质组的简单单向流动,两者之间存在非常复杂的相互调控机制。从目前的研究结果来看,除少数特殊情况外,转录组的数据与蛋白质组的数据是互补而不是简单的一致[4,5]。由此说明转录组学技术与蛋白质组学技术具有不完全性和互补性。两者数据相互结合才能更加立体全面地认识基因的表达状态。

[3]      挖掘转录后调控机制

从转录本到蛋白质中间需要经过复杂的转录后调控机制。通过挖掘转录组与蛋白质组数据中不相关或者负相关的数据可以有效地寻找到转录后调控过程中具有关键作用的调控基因/蛋白质。

■ 转录组学与蛋白质组学数据整合分析流程及内容:

转录组学与蛋白质组学数据整合分析流程及内容如下图:

图1. 转录组学与蛋白质组学数据整合分析流程及内容

[1]     将转录组测序数据翻译成蛋白质组学分析数据库

对于非模式物种或者其他蛋白质数据库不全的物种来说,采用自身转录组测序数据翻译成的蛋白质组数据库,可以显著提升蛋白质组学分析的效果。目前已经有非常多的案例采用该思路来开展蛋白质组学研究,并且取得了很好的效果[6]

图2. 棉花营养器官采用不同蛋白质组数据库分析结果

[2]     蛋白质与基因的表达量关联分析

一方面可以将所有定量的蛋白质和与其关联的转录本进行表达量的相关性分析,该分析结果往往表明两者的相关性较差,从而说明两个组学分别进行研究的重要性。另一方面,还可以对差异表达蛋白质和与其关联的差异表达转录本进行相关性分析

图3. 差异蛋白质与差异基因的表达量关联分析[7]

[3]     GO功能和Pathway通路比较关联分析

以差异基因和差异蛋白质的GO和Pathway分析结果为依据,进行两个组学水平上功能和通路的关联分析。对在两个组学数据中能关联上的GO或Pathway中的基因以及蛋白质的表达情况进行一致性分析,以此为立足点,寻找具有重要调控作用的基因/蛋白质。该项分析需要结合研究课题的具体情况展开。

[4]     蛋白质组与转录组表达聚类分析

利用Cluster聚类分析软件,对所有可以定量的蛋白质及其关联转录本的表达量、或者对差异蛋白质及其关联转录本的表达量进行聚类分析。该分析结果可以直观地展示两个组学水平上蛋白质和基因的整体变化情况。

 

图5. 差异蛋白质及其关联转录本的表达量聚类分析

[5]     可变剪接相互印证

真核生物中存在非常复杂的可变剪接机制,这使得转录本及其相应的蛋白质多样性大大增加。目前应用非常广泛的可变剪接研究思路是:在转录组的水平上预测可变剪接形成的新转录本,然后在蛋白质组的水平上采用Shotgun技术验证其可靠性[8]

图6. 可变剪接示意图

参考文献:


[1]     Nesvizhskii Al. Proteogenomics: concepts, applications and computational strategies. Nature Methods. 2014; 11(11): 1114-1125.

[2]     Chiang CK, Mehta N, et al. The Proteomic Landscape of the Suprachiasmatic Nucleus Clock Reveals Large-Scale Coordination of Key Biological Processes. PLOS Genetics. 2014; 10(10).

[3]     Tarun AS, Peng X, et al. A combined transcriptome and proteome survey of malaria parasite liver stages. PNAS. 2008; 105(1): 305-310.

[4]     Wang H, Zhang Q, et al. Transcriptomics and proteomics in stem cell research. Front Med. 2014; 8(4): 433-444.

[5]     Tarun AS, Peng X, et al. A combined transcriptome and proteome survey of malaria parasite liver stages. PNAS. 2008; 105(1): 305-310.

[6]     Yoshida MA, Yamada L, et al. Integrative omics analysis reveals differentially distributed proteins in dimorphic euspermatozoa of the squid, Loligo bleekeri. Biochem Biophys Res Commun. 2014; 450(3): 1218-24.

[7]     Zheng BB, Fang YN, et al. iTRAQ-Based Quantitative Proteomics Analysis Revealed Alterations of Carbohydrate Metabolism Pathways and Mitochondrial Proteins in a Male Sterile Cybrid Pummelo. J Proteome Res. 2014; 13(6): 2998-3015.

[8]     Ericson M, Janes MA, et al. On the extent and role of the small proteome in the parasitic eukaryote Trypanosoma brucei. BMC Biol. 2014; 12: 14.



   
© 2010 - 2016 上海中科新生命生物科技有限公司 版权所有