专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
生物探索  ·  Nature Methods | ... ·  3 天前  
BioArt  ·  Cell Stem Cell | ... ·  昨天  
生物探索  ·  Nature Medicine | ... ·  4 天前  
BioArt  ·  Nature | ... ·  4 天前  
51好读  ›  专栏  ›  生信菜鸟团

一文读懂 ChIPseq

生信菜鸟团  · 公众号  · 生物  · 2020-11-25 21:00

正文

目录


一、介绍

二、测序原理

三、检测蛋白质与DNA序列的结合峰

1、测序片段匹配到参考基因组

2、检测峰

3、提高峰质量

四、影响ChIPseq测序结果的因素

1、免疫共沉淀的影响

2、测序的影响测序深度的对组蛋白修饰检测的影响

3、重复样和重现性



介绍


ChIP-seq,测序方法

  • ChIP 指染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP),

  • seq 指的是二代测序方法

作用: 识别蛋白质与DNA互相作用情况

原理: 染色质免疫共沉淀 + 二代测序

应用: 常用于转录因子结合位点和组蛋白修饰位点的研究


测序原理


1、 使用甲醛将目标蛋白(组蛋白,转录因子等)与染色质交联固定起来

2、 从细胞裂解液分离基因组DNA,通过超声打断DNA为一定长度的小片段

3、 添加与目标蛋白质特异的抗体,该抗体会与目标蛋白形成免疫结合复合体沉淀,收集这些沉淀

免疫结合复合体 = 靶蛋白 + 抗体 + 靶蛋白结合的DNA

4、 去交联,分开蛋白与DNA,纯化DNA即可得到染色质免疫沉淀的DNA样本

5、 建立好文库,用测序仪进行测序

详细测序过程可以参考: https://zhuanlan.zhihu.com/p/58708887


检测蛋白质与DNA序列的结合峰


1
测序片段匹配到参考基因组

将测序得到的 DNA 片段(sequenced fragments)匹配到参考基因组。

很显然,如果在基因组的某个位置蛋白质结合的概率越大,那么在该位置检测到 DNA 片段堆叠就会越高。反之,如果没有蛋白结合,在该位置就会几乎没有DNA 片段堆叠。为了研究方便,我们将这些DNA片段堆叠叫做峰 (Peak)。

2
检测结合峰

将覆盖到参考基因组的DNA片段堆叠用柱状图画出来,就会看到峰。

这里需要知道,ChIPseq是利用抗体去结合特异的靶蛋白,进而去沉淀靶蛋白结合的DNA。理论上,只要抗体设计的好,与蛋白质结合的 DNA 的都可以检测到。

我们一般用 ChIPseq 检测转录因子的结合,以及检测组蛋白修饰,二者有着截然不同的峰形:

转录因子结合的特征峰,峰型高,而且窄:

组蛋白修饰结合的特征峰,峰型起伏,而且分布广泛:

当然我们也可以使用,UCSC基因组浏览器显示。

3
提高峰质量

一般在做ChIPseq时,会加入一组空白对照(control),提高峰质量,那么为什么?

  • 一般检测出的峰值会有背景噪音,也就是文库会夹渣一些没有用抗体捕获的DNA片段也被测序了。

  • 开放的染色质区域比封闭的区域更容易断裂

  • 序列在基因组中分布不均

  • 允许我们在比对的控件中与相同区域进行比较

  • 消除 ENCODE 的 Black list的影响

所以会准备空白对照,排除假阳性,对照组有有两种类型:

  • input DNA:不用任何抗体捕获的DNA;

  • mock IP DNA:用不含有抗体的DNA

这样一来,就会让我们检测到的峰更明显更接近真实的生物学特征。


影响ChIPseq测序结果的因素


1
免疫共沉淀的影响
  • 高效特异性抗体

  • 起始样本量

  • ChIP DNA 产量

    • 细胞类型

    • 标记或蛋白质丰富程度(组蛋白比TF具有更高的结合覆盖率)

    • 抗体质量

对于组蛋白,使用来自T细胞的20ug染色质DNA作为起始材料,总共会得到15-50ng DNA。

对于TF,通常从2500万个细胞(200ug染色质)中得到5-25ng。

-Subhash Tripathi,ResearchGate

  • 染色质片段

    • 片段大小:影响ChIP-seq中的信噪比

    • 因细胞类型而异







请到「今天看啥」查看全文