新闻资讯

代谢组学医学应用篇(上)——肝癌的诊断标志物

2018-05-17
中科新生命
4218

今天我们将为各位老师开启代谢组学在医学上应用篇─标志物的筛选。之前小编已经为大家介绍过一篇从尿液中筛选肺癌诊断标志物的文献(详情点我),感兴趣的老师可以去看看。今天要介绍的一篇文献是关于肝癌的诊断标志物筛选。


肝癌是全世界范围内最普遍的一种肿瘤,2014年最新的全球癌症统计数据显示,每年的原发性肝癌新发病例发展中国家占83.7%,死亡病例发展中国家占83.4%。而我国是肝癌发病重灾区,患病率和死亡率占亚洲近70%,居亚洲之首。肝癌的早期诊断对于防治肝癌至关重要。目前广泛使用的肝癌的诊断标志物甲胎蛋白(AFP)的灵敏度较低,很难作为早期的诊断标志物进行检测,因此为了提高肝癌患者的存活率,寻找肝癌的早期诊断标志物十分重要。

Metabolic Characterization of Hepatocellular Carcinoma Using Nontargeted Tissue Metabolomics.

从组织中筛选肝癌诊断标志物

Cancer Research IF=9.6


研究材料:

组织以及血液样本


技术方法:

非靶代谢组学+靶向代谢组学,内部验证+外部验证



研究路线:



研究结果:

1. 样本选择:

在这篇文献中,作者研究的样本类型有组织、血浆两种,研究的人群队列有3组,样本数量一共用到403例,病人根据肝病的严重程度被分为肝炎、肝硬化、肝癌三组,并且有详细的临床特征参数记录,如下图所示。对于临床biomarker的筛选,样本的选择是成功的第一步,一般要求样本的数量尽可能的多,样本对应的分组尽可能细致,样本对应的人群尽可能有详细的临床参数记录。作者的研究满足大样本、严格的实验设计、详细的临床特征参数三大要素,因此筛选出来的biomarker具有非常强的说服力,具有临床的应用潜力。

2. 组织样本的研究

(1)组织样本的代谢物检测

作者首先选择了50例肝癌患者的癌组织(HCT)与近端癌旁组织(ANT)以及远端癌旁组织(DNT),采用非靶向代谢组学技术对这些组织样本中的代谢物进行定性定量检测分析,并对检测的代谢物的进行多元变量统计分析,从下图(PLS-DA图)可以看出:癌组织与近端以及远端癌旁组织样本之间区分明显,即癌组织与近端以及远端癌旁组织的代谢表型差异显著。


(2)筛选差异物

对检测到的代谢物,做进一步的差异筛选。通过进一步的统计分析,筛选到105个在癌组织、近端癌旁组织、远端癌旁组织中存在显著性差异的代谢物,展示部分差异代谢物的信息如下所示。

(3)差异物的生信分析

找到差异代谢物之后,进一步做生信分析挖掘代谢物之间的相关性以及进行通路注释。筛选到的差异代谢物主要是脂肪酸、胆汁酸、氨基酸、糖、磷脂等物质,作者做了进一步的生信分析:

  1. 差异物之间的相关性研究:相关性网络图(图左)。

  2. 差异代谢物参与的代谢通路分析:KEGG分析(图右)

相关性网络图分析表明高表达(红色)的SFA/MUFA与低表达(绿色)的PUFA之间相关性良好。KEGG分析表明差异代谢物主要是参与糖酵解通路、TCA循环、氨基酸代谢以及脂肪酸代谢通路,反映出肿瘤细胞表现出更加旺盛的能量需求。

3. 血液样本的研究

血液样本进行非靶代谢组学分析,寻找之前在组织样本中差异表达的代谢物。了更一步分析癌组织与癌旁组织筛选到的差异物是否具有作为临床诊断的潜力,对发现队列中的298例血浆样本(81例肝炎、78例肝硬化、139例肝癌)进行非靶向代谢组学分析,用于进一步从再次检测到的差异代谢物中筛选出潜在标志物。临床诊断更倾向于使用生物体液样本,相比组织样本更容易获取,创伤更小,所以作者转向血液样本的分析。

4. 标志物的筛选

(1)相关性分析-初筛

相关性分析,从血液和组织样本的共同差异代谢物中初筛标志物。目前广泛使用的肝癌的诊断标志物甲胎蛋白(AFP),但为了从差异物中找到可以与AFP互补的标志物,将血液中再次检测到的差异物与血浆中的AFP进行皮尔森相关性分析(Pearson correlation analysis),找到了8个与AFP不相关的差异物(皮尔斯相关系数|Cij| < 0.15视为不相关)。

(2)构建诊断模型-再筛

构建诊断模型,从初筛的标志物中做进一步筛选。8个候选的诊断标志物中进一步筛选到了2个候选诊断标志物(甜菜碱、丙酰肉碱)。如下图所示,这两个标志物在肝癌患者中的相对表达量显著下调,组合在一起能够对肝癌和慢性肝病(298例样本)能够进行良好的区分( ROC AUC=0.982),明显优于甲氧蛋白AFP的诊断能力(ROC AUC=0.697)。

5. 标志物的验证

(1)内部验证-第一重评价

为了评价和验证筛选出的差异物是否具有良好的诊断能力,首先进行内部验证即将发现队列的298例样本中的一部分样本作为训练集(training set)用来构建诊断模型,剩余的样本作为测试集(test set)用来测试筛选出的标志物的诊断能力。结果如图所示:在训练集中,模型对慢性肝病和肝癌诊断的准确性分别达到91.6%和96.8%,表明模型建立良好。在测试集中,模型对慢性肝病和肝癌诊断的准确性分别达到94.2%和93.5%,表明筛选到的标志物诊断能力良好。 

(2) 外部验证-第二重评价

内部验证通过之后对其他来源的样本进行靶向检测,进一步用来排除假阳性和评价标志物的诊断能力。甜菜碱、丙酰肉碱标志物组合构建的诊断模型表现出良好的诊断能力。那这两个标志物是否具有普适性能够应用于临床上进行诊断呢?因此不同来源的样本被用来做进一步的验证,也就是所谓的外部验证。

对47例(22例肝炎、22例肝癌)血液样本中的甜菜碱、丙酰肉碱进行靶向分析(靶向代谢组学),结果表明甜菜碱、丙酰肉碱均在肝癌患者中呈显著的下调,与之前的测试结果一致,排除了假阳性的结果。标志物的评价测试结果表明诊断能力良好,甜菜碱、丙酰肉碱组合进行疾病诊断准确率可以达到80%以上,具有临床应用的价值。


结论:

甜菜碱、丙酰肉碱组合能够对肝脏疾病进行良好的预测,可以作为临床肝癌的诊断标志物甲胎蛋白AFP的补充诊断手段。

小编心得:

(1)研究套路总结

这篇文章的研究套路是遵循非靶向分析+靶向代谢分析,内部验证+外部验证的原则。

  1. 非靶向分析+靶向分析:非靶向分析,即非靶向代谢组分析,借助于组学的高通量分析能力获取大量数据,适用于前期筛选可能的标志物;靶向代谢分析,即对特定的代谢物进行选择性、特异性检测,适用于后期对候选标志物进行验证,排除假阳性的结果。

  2. 内部验证+外部验证:标志物筛选出来后需要做进一步的验证和评价来断标志物的诊断能力。发现队列随机分成训练集(training set)和测试集(test set)用来做第一重的内部验证,其他来源的样本被用来做外部验证。

正是因为这样的实验设计使得这篇文章的逻辑更为严密,说服力更强,结论更加可靠。建议以后要做大样本标志物筛选的老师也采用这种非靶向+靶向,内部验证+外部验证的模式,从而筛选到真正有望应用于临床实践的标志物。

(2)样本的选择值得借鉴

代谢物的丰度受很多因素影响,比如说采样的部位,个体化差异等等。这边文章里面样本选择很有特色:

第一点,组织样本的选择很考究。设置了癌组织、近端癌旁组织和远端癌旁组织三个组别,进行了更加细化和全面的代谢表型研究,规避掉采样部位可能对实验结果造成的影响。

第二点:人群队列的设置很考究。分为肝炎、肝硬化、肝癌三种肝病类型。这样的设置可以放大不同疾病之间的差异,缩小内部差异,帮助建立更加精确的诊断模型,从而有利于真正有价值的标志物的筛选。

(3) 文献推荐

非靶向初筛Metabolic signaturesand risk of type 2 diabetes in a Chinese population: an untargeted metabolomicsstudy using both LC-MS and GC-MS.Diabetologia IF=6.1

非靶向初筛+靶向验证Non-invasive urinary metabolomic profiling identifies diagnostic andprognostic markers in lung cancer. Cancer research IF=9.6 

内部验证+外部验证ComprehensiveMetabolomic Characterization of Coronary Artery.  Diseases. Journal of theAmerican college of cardiology. IF=19.9

内部验证+外部验证:Metabolite profiles and the risk of developing diabetes. Nature Medicine. IF=29.9