【REVIEW】你从哪里来,差异蛋白!
你从哪里来,我的差异!
差异蛋白质筛选标准
在上篇分享中,我们着重介绍了统计学方法的类别及其应用。一般大规模组学目标是找出对照组与不同处理组间蛋白表达水平有差异的蛋白,那么,从茫茫数据中获得需要重点关注的差异蛋白这么关键的一步究竟是怎么样的一个标准呢?技术小编也频繁接到老师的咨询疑问,你们是按照什么标准对我们的数据进行筛选的呢?哈哈,今天就让我们一起来揭开这个神奇的面纱~
一般地,我们会选取p-value值和fold change值这两个标准来对差异蛋白进行筛选。
首先讲讲P-value值是如何获得的。上次的干货没有认真看吧。唉,依然很高深难懂有没有,没关系,机智的你只有记住在蛋白质组学中的p-value值一般设置成<0.05这个标准就行了,小于0.05 说明小概率事件都发生了,你说显著不显著。
如果你是真的爱学习,对p-value的计算方法非常有兴趣,不妨戳上篇推文链接认真了解→【老生常谈】P值是如何来的!
接着轮到Fold change登场了,Fold change嘛,顾名思义,就是两个样品中同一个蛋白的表达差异的倍数,主要由定量值进行计算的。该值主要反映的是组间变化的倍数情况,再加上上述p value 的显著性,设定一定的阈值即可挑选出符合标准的差异蛋白质了。
那倍数标注如何确定呢?这个就仁者见人,智者见智了。
就大规模数据来说,一般非标定量项目差异倍数绝对值在两倍或者1.5倍,当然如果老师获得的差异蛋白特别多,那么可以通过提高筛选倍数来缩小差异范围。标记定量项目一般选择差异倍数绝对值>1.2或者1.5倍,大家又要问了,为什么差距这么大。这个原因就相当相当复杂了,当然有文献的和大家惯用的标准有关,也会技术方法本身的误差及呈现方式有关。但是小编认为,标准固然重要,但是是否能验证出来更重要,组学方法是大通量数据筛选,是在茫茫数据海洋中缩小范围,标准和如何选择当然是人为定义,不管定义的标准如何,只有经得起验证的结果才不是伪结果。毕竟科学研究困难重重,意外不断,惊喜连连,面对老师的这么多不同物种不同组织的研究背景,具体问题具体分析还是很有必要的。
另外,还有一种情况,对于通过one way ANOVA方法进行统计分析的项目是没有Fold change这一数值的,因此只能通过筛选前面所述的P-value进行数据分析。或者结合post-hot进行两两组间的比较。
当然实验之路漫漫,任何科研都不一定是一帆风顺的,即使说您的预期结果不理想,也不要懊恼,因为有APT一直在,会帮您分析,给您最适合解决方案。