当前位置:首页 > ChIA-PET配对末端标签测序分析染色质相互作用
ChIA-PET样品的制备和方法描述
细胞培养和染色质免疫沉淀
通常可以用以下五种细胞系作为RNA聚合酶ⅡChIA-PET分析的研究: MCF7 (ATCC# HTB-22), HCT116 (ATCC# CCL-247), HeLa (ATCC# CCL-2.2), K562 (ATCC# CCL-243) and NB4 (provided by Dr. Sherman Weissman, Yale University)。细胞采用常规培养,在对数生长期时进行收集。用1%甲醛室温旋转处理10mins后,加入0.2M甘氨酸中和,然后加入细胞裂解液和细胞核裂解液,获得交联的染色质。接着,将染色质用 Branson digital sonifier S450D超声仪进行超声处理,使之成为平均长度为300bp的片段,超声后的染色质用蛋白G磁珠孵育过夜,进行预纯化,以除去非特异性结合的DNA,与此同时,用RNA聚合酶Ⅱ的单克隆抗体8WG16(Covance,MMS-126R)孵育蛋白G磁珠过夜,使抗体结合在磁珠表面。次日,将预纯化后的染色质用抗体包被后的磁珠沉淀过夜,使磁珠与我们所需的目标染色质想结合。再用洗涤液将包被后的磁珠清洗几次,以除去非特异性的结合。最后,用洗脱液将结合到的ChIP-DNA从珠子上洗脱下来,用 Picogreen fluorimetry测定浓度,用q-PCR对DNA进行相对定量。 ChIA-PET文库的建立
免疫沉淀的染色质碎片接着用于ChIA-PET文库的建立方法我们已经在之前的研究中叙述过。简单来说,将带有抗体磁珠的染色质DNA碎片分为两等分,分别用不同DNA半连接子(A/B)连接,两个连接子除了中间的两个核苷酸不一样之外(连接子A是CG;连接子B是AT),其他部分的核苷酸序列完全相同,链接子可以超过DNA碎片的末端。在连接子进行连接后去除多余的序列,将两部分混合,两等分又会重新结合到一起发生邻近式连接,在这里不同染色质复合物的DNA碎片可以具有一样的连接子(A或是B)。在邻近连接时,如果同一个染色质复合物内的DNA碎片被相同的连接子一起连接,那么则会产生同源二聚体形式的连接产物(AA或者BB)。然而,如果连接反应发生在不同染色质复合物的DNA碎片之间,那么这样非特异性连接的产物将有50%的几率形成异源二聚体的形式(AB或者BA)。因此,这些异源二聚体的连接子可以作为非特异性连接的标志,可以用来评估每一次建立ChIA-PET文库发生非特异性连接概率的大小,并且这些非特异性连接的数据还可以用来作为后续的分析使用。在邻近连
接之后,获得的连接产物可以用来提取配对的末端标签(PET),这些末端标签的模板将被用来作Illumina GAll测序分析。 ChIA-PET文库的数据处理
ChIA-PET序列读数有专门的ChIA-PET工具进行处理,这是一个进过修饰后的专门为ChIA-PET数据所涉及的软件包。简单来说,非多余(non-redundant)的PET序列读数最先进行连接子条形码(barcode)组成的分析,定义为来源于非特异连接的产物——异源二聚体AB连接子(条形码为CG/AT),或者为来源于特异的连接产物——同源二聚体AA或者BB连接子(条形码为CG/CG或者AT/AT)。连接子的组成可以用作下游的噪音分析。接着,将连接子序列进行整理后,在人类基因组上(hg19)绘制出PET标签序列。为了进一步除去多余的PET序列,在基因组标记之后,PETs在基因组从头部到尾部的标签包含2bp的位置与不断减少的来源于克隆PCR扩增后的文库序列进行融合,这一步计算出任何一个位于相关的序列和检测基因组之间的单核苷酸多态性(SNPs),测序误差有可能会发生,并且导致标签序列出现1或2bp的误差。 PET分类
PET测序的绘图与基因组相结合可能揭示出邻近连接产物的本质,无论是同一个DNA碎片两端之间产生的自连接产物还是两个DNA碎片之间的间连接产物,他们都被同一个染色质复合物通过蛋白的相互作用进行捕捉。因为染色质碎片的大小是已知的,范围在100bp到几个kb,绘图的起点以及PET序列两个标签之间的长度可以显示出这个PET是来源于自连接还是间连接。间连接的PETs可以分为两类:染色体内的PET——两个PET的标签定位于同一个染色体,染色体间的——两个PET的标签定位于不同的染色体。方便起见,我们将来源于自连接的PETs称为“自连接PETs”,定位在同一个染色体的间连接的PETs称为“染色体内PETs”,定位在不同染色体的间连接的PETs称为“染色体间PETs”。 RNA聚合酶Ⅱ的峰值检出(peak calling)
基因组中自连接PET序列的覆盖率(coverage)反应了RNA聚合酶Ⅱ染色质免疫共沉淀的特定位点的丰富程度,与ChIP-Seq反应蛋白在染色质的定位类似。我们采用与ChIP-Seq峰值检出程序MACS相同的方法来获取ChIA-PET数据的峰值检出。序列覆盖局部的顶点称为潜在峰值(potential peak)。潜在峰值的意义
在于评估Poisson分布的P值。这个P值与多假设检验采用B-H方法所得的错误发现率(FDR)一致。我们所得的最终峰值(final peak)的标准是:1,最小序列的覆盖率是5;2,FDR<0.05. PET集(clusters)的相互作用
间连接PETs潜在反应了远程染色质的相互作用。然而,不可避免的是不同的来源都会存在技术上的噪音。为了进一步从非特异的相互作用信号中区分出这些真正的相互作用信号,我们推断,对于真正的、多重的相互作用PETs有可能会从同一个相互作用的区域产生。为了定义这样的染色质相互作用,绘制间连接的PETs定位图将会延长到1.5kb下游,并且这些PETs在两端覆盖形成了相互作用的PET集。这些称为一个PET集的PET反映了相关的两个位点之间的相互作用频率。这种相互作用之间统计学的显著性由超几何分布的P值来进行评估。超几何模型将与P值计算相关的锚区域(anchor regions)的标签数一并考虑,这样可以中和由于富含区域之间的随机连接而导致间连接PETs的潜在噪音升高的效应。P值与多假设检验用B-H方法所得的错误发现率(FDR)一致,FDR<0.05。 总结ChIA-PET数据处理的主要特征:
我们的ChIA-PET数据处理主要按照ChIA-PET工具的步骤。有以下几点改变: 1、 改变了连接子的序列和连接子的筛选(filtering)过程
连接子序列是 GTTGGATAAGATATCGCGG和GTTGGAATGTATATCGCGG。新的连接子筛选程序见
http://chiapet.gis.a-star.edu.sg/downloads/chia-pet-tools 2、 改变了PET集
之前,间连接PETs富含区域最先在ChIA-PET工具中出现,现在PET集检测了PETs的重叠 3、 后筛选
PET集将由以下标准筛选出: ? PET计数<=2; ? FDR>=0.05;或 ? 范围<8Kb
剩下的PET集将保存在EXCEL表格中,留作后续分析。
(ChIA-PET Protocols — ChIA-PET http://chiapet.gis.a-star.edu.sg/protocols)
共分享92篇相关文档