新闻资讯

Genome Biology(IF 12.3)| 英国伦敦大学DNA甲基化队列研究揭示其可变性新机制

2023-11-10
中科新生命
1031
DNA甲基化是基因功能的主要调节因子,在发育和生命过程中具有重要作用。多项研究表明,遗传效应对特定CpG的DNA甲基化水平有很大影响。目前人类甲基化分析最广泛使用的分析技术是Illumina EPIC芯片。

DNA甲基化是基因功能的主要调节因子,在发育和生命过程中具有重要作用。多项研究表明,遗传效应对特定CpG的DNA甲基化水平有很大影响。目前人类甲基化分析最广泛使用的分析技术是Illumina EPIC芯片。

2023年7月,来自英国伦敦大学国王学院双胞胎研究和遗传流行病学系团队在Genome Biology(IF 12.3)杂志上发表题为“Genetic impacts on DNA methylation help elucidate regulatory genomic processe”的研究文章,该研究报告了Illumina EPIC阵列上DNA甲基化的新型全基因组meQTL分析,对来自三个英国人群队列的2358份样本进行了荟萃分析。

2023年7月,来自英国伦敦大学国王学院双胞胎研究和遗传流行病学系团队在Genome Biology(IF 12.3)杂志上发表题为“Genetic impacts on DNA methylation help elucidate regulatory genomic processe”的研究文章,该研究报告了Illumina EPIC阵列上DNA甲基化的新型全基因组meQTL分析,对来自三个英国人群队列的2358份样本进行了荟萃分析。

 

 

 研究材料

研究材料

 

 

 技术路线

图1 全基因组关联分析比较基因型和EPIC阵列分析的DNA甲基化水平

图1 全基因组关联分析比较基因型和EPIC阵列分析的DNA甲基化水平

 

 

 主要结果

1. Illumina EPIC DNA甲基化的遗传力研究

 作者对TwinsUK队列中的88对单合子(MZ)和70对双合子(DZ)双胞胎进行研究,在所有检测的CpG中,平均全基因组狭义遗传力为A = 0.138(SD = 0.198;中位值A = 0.037,IQR = 0.220),当通过基因组注释进行分层时,增强子中的CpG总体上倾向于具有更大的遗传力估计值(平均值A = 0.179,sd = 0.217,95% CI [0.178,0.181])。总体而言,EPIC探针和450K传统探针之间的基因组注释的遗传力模式是一致的,作者还发现可变CpG位点往往是最可遗传的。

图2 全基因组DNA甲基化水平因遗传变异引起的方差比例

图2 全基因组DNA甲基化水平因遗传变异引起的方差比例

 

2. 常见的遗传变异对血液甲基化的影响

为了确定影响甲基的特定遗传变异体,对三项非重叠人类队列研究(TwinsUK,1946BC和1958BC)的五个数据集的总计2358份全血样本进行了meQTL分析。测试每个数据集中所有SNP-CpG对的关联性。1 Mbp(上游和下游)内的CpG和SNP关联被视为cis,所有其他关联被视为trans,共有189,202,234个候选cis meQTL-CpG对(P≤5×10-3)和100,814,822个trans对(P≤5×10-6)。作者确定244,491个CpG(受试探针的33.7%)受cis-meQTL SNPs影响,5219个CpG(受试探针的0.7%)受trans- meQTL SNPs影响,通过将CpG分成两组(450K传统探针和EPIC特异性探针)并重复meQTL发现过程来进行敏感性分析,发现所报告的meQTL比例仍然非常相似。总体而言,具有顺式和反式meQTLs的CpG具有最大的DNA甲基化遗传力证据。

图3 CpG位点全基因组DNA甲基化定量性状基因座(meQTL)

图3 CpG位点全基因组DNA甲基化定量性状基因座(meQTL)

 

3. 用meQTL复制新的EPIC特异性和450K遗留CpG

使用之前发表的MeDIP-seq数据,在Twin- sUK队列的2319名个体的独立样本中,在选定的CpG中研究了meQTL效应的复制,经过多次测试校正并具有一致的作用方向。观察到51.2%的cis-meqtl CpG(125,251 CpG)和37%的trans-meqtl CpG(1933 CpG)对EPIC阵列具有特异性。对于其余45万个meQTLs的传统CpG,作者通过将它们与基于32,851份血样的GoDMC数据库进行比较,并验证。总之,在450K特异性CpG中,97.0%的meQTLs(顺式或反式)在GoDMC数据集中也受到遗传影响。

 

4. 局部和远端遗传效应的基因组注释显示增强子的富集一致

作者发现CpG的基因组注释与顺式和反式meQTLs的总体对比模式相关。位于CpG岛(CGI)、启动子和转录因子结合位点(TFBSs)的CpG不太可能含有cis-meqtl,而更可能有反式meqtl。位于基因间区、增强子和绝缘体的CpG更可能同时具有顺式和反式meQTLs。接下来,作者探索了不同基因组注释中meQTL SNPs的富集或缺失,作者在不同注释中比较了每个CpG位点最显著相关的meQTL SNPs与全部测试遗传变异体的比例,与观察到的CpG结果相反,发现根据基因组类别,顺式和反式meQTLs的分布模式一致。因此,与在遗传控制下观察到的CpG基因组模式不同,驱动meQTL效应的遗传变异体显示出相似的局部和远端遗传效应基因组分布。简而言之,观察到在增强子中CpG明显富集meQTL和meQTL SNPs。

图4 meQTL SNPs及其CpGs基因组注释的富集

图4 meQTL SNPs及其CpGs基因组注释的富集

 

5. 功能整合有助于深入了解对甲基化的长期遗传影响

首先,将meQTL结果与eQTLGen财团的数据结合起来,这是迄今为止最广泛的eQTL资源,对来自37个以欧洲血统为主的队列的31,684名个体的血液样本进行了研究。总体上,作者观察到了cis-meqtl和eQTLs之间共定位的有力证据,这与之前的发现一致。总共有44.2%的表达基因与DNA甲基化有共同的遗传基础,这比以前报道的要高。使用跨meQTL的SMR分析还发现了许多meQTL和eQTL共定位事件。总共有642个独特的反式meQTL SNPs与cis- eQTLs共定位,同时影响709个CpG和782个基因,结果可能反映出影响参与直接或间接全局表观遗传调节的基因表达的遗传变异体也是来自Villica和Bell的反式meqtl。cis-meQTL与cis-eQTL共定位的结果也允许做出推断远端遗传影响DNA甲基化水平的机制。作者对meQTLs进行了另外两次功能探索分析,首先,搜索了与基因组三维(3D)构象重叠的meQTL-CpG关联,如拓扑相关结构域(TADs),结果36.5%的具有染色体内反式meQTL的CpG与其最相关的meQTL具有相同的TAD。这支持了作者的假设,即tad可能会使跨meQTLs与它们的目标CpG在物理上接近。总之,结果与一些染色体内反式meqtl可能在TADs中充当“长距离”顺式-meqtl的假设一致。其次,作者研究了位于编码区内的反式meqtl的GO分析,以检测反式meqtl是否可能改变TFs等蛋白质的功能,结果支持假设,即反式meQTLs可能会改变TFs等蛋白质的功能,进而影响多基因组区域的DNA甲基化水平。

图5 meQTL SNPs的潜在机制

图5 meQTL SNPs的潜在机制

 

6. 高度连接的CpG和meQTL

作者计算了每CpG meQTL SNP关联的有效数量,剔除了因LD引起的冗余SNP。在LD成块后,受遗传控制的CpG往往没有什么关联,每个CpG的cis中位值为2,trans中位值为1。总体上与顺式和反式关联最大的CpG是新型EPIC探针cg16423305 (42个顺式和21个反式meqtl)、cg00128506 (48个顺式和13个反式meqtl) 和cg25014118 (50个顺式和6个反式meQTLs)。接下来,作者考察meQTL SNPs的连通性,观察到与聚集meQTLs每个区域相关的五种独特顺式-CpG的中位值(IQR = 10),以及一种反式-CpG的中位值(IQR = 1)。在高度连接的CpG和遗传区域中,特别值得注意的是主要组织相容性复合体(MHC)区域,该区域在具有遗传效应的CpG和属于meQTL的SNPs中的比例过高。该位点包含多个高度调控的CpG和关键的调控meQTL区域,用于顺式和特别是反式关联。

 

7. 遗传变异、DNA甲基化和复杂性状之间的相互作用

作者使用meQTL来鉴定cis-meQTL SNPs和GWAS SNPs之间的共定位,这些SNPs来自分组为七个表型类别的56个常见人类复杂性状。对186,817个受试CpG位点和7个表型类别进行Bonferroni校正后,通过1325个独特CpG之间的共定位识别了1520个关联和34个性状,涉及1180个独特的cis-meqtl。生长和年龄(包括身高)是具有最多共定位和598个独特CpG位点的表型分类。总体而言,与其他具有meQTLs的CpG相比,具有GWAS共定位的CpG在CGI、编码和监管区域更丰富。总之,这些整合分析的例子突出了target遗传变异体与多个CpG处的DNA甲基化、几个基因处的基因表达以及许多复杂的代谢特征和疾病之间的联系。这些新的联系为特定GWAS变体在选定人类表型中的作用机制提供了功能性见解。

图6  IBD与cg19297788位点DNA甲基化的关系

 

 

 产品特色

全基因组覆盖,CpG位点升级

Illumina EPICv2.0(935K)芯片可检测人全基因组约935,000个CpG位点的甲基化状态,在850K的基础上去除了性能不佳的探针:

新增186,000个CpG靶向增强子和超级增强子;

更多CTCF结合位点、CNV检测区域、EPIC v1.0覆盖不足的CpG岛以及常见癌症驱动突变;

还增加了经ATAC-Seq和ChIP-Seq实验鉴定的与肿瘤有关的染色质开放区域;

此外,基因组版本更新到hg38以及GenCode数据库v41版本,是更适合用于表观基因组全关联分析研究(EWAS)的一款芯片。

兼容多种样本类型,包括FFPE

FFPE组织样本可获得高质量数据,FFPE兼容性对于癌症研究极为重要,能够支持以大型肿瘤生物样本库为基础的研究。935K芯片检测兼容样本:(1)FFPE;(2)新鲜/冷冻组织;(3)全血;(4)细胞;(5)cfDNA。

高度准确和精确的检测数据

935K甲基化芯片检测能够检测到0.2的beta值差异,假阳性率低于1%,从而实现了较高的分析灵敏度,同时也具有极好的数据可重现性。如下图(A)935K芯片技术重复相关性R2>0.99(B)935K芯片和850K的交集探针间的相关性R2>0.99。(C)935K芯片数据与甲基化测序(100×测序深度)的相关性R2>96%。

产品特色

 

 

中科新生命优势

自主检测平台

中科新生命强力引入Illumina iScan系统,旨在为表观研究的客户提供高效率、低成本的一站式甲基化服务平台。

数据稳定可靠

Illumina Infinium MethylationEPICv2.0 BeadChip甲基化芯片作为一款优秀的芯片,芯片数据的稳定与可靠可以通过芯片的技术重复直观的体现,其本身的技术重复相关性R2>0.99。

实测项目数据展示(左图为单张芯片8样本间技术重复性,右图为3张芯片批次间重复性)

 

 

中科优品推荐

Illumina DNA甲基化芯片是一种全基因组甲基化筛选工具,该芯片保留了以单核苷酸分辨率定量分析全基因组CpG的能力,同时提供高度准确和精确的甲基化测量,不受测序深度的影响。可使用精简、用户友好的Infinium甲基化检测分析多种DNA样本类型,包括从FFPE分离的DNA样本。与其他方法相比,Illumina DNA甲基化芯片具有可扩展性和更低的单个样本总成本,因此可用于探究疾病机制和生物标志物的筛选。

<<  滑动查看下一张图片  >>