单分子长读长测序(LRS)技术彻底改变了基因组学、转录组学以及最近的表观基因组学研究。今天,小编要和大家分享一篇
2025年1月
发表在
Nature Genetics
(IF:31.8)
上的综述,
讨论了基于LRS表征染色质状态,及其相对于短读长测序方法(SRS)的优势。
此外,还讨论了
如何整合各种长读方法来设计多组学研究,以研究染色质状态与转录动力学之间的关系。
扫码添加 ⬪ 精彩内容抢先看
个性解读|课题设计
生信热点|直播分享
长读长测序(LRS)技术(也被称为三代测序)由Oxford Nanopore Technologies (ONT)和Pacific Biosciences (PacBio)等公司推出,在人类基因组从端粒到端粒的完整测序中发挥着至关重要的作用。除了基因组学之外,
LRS 在表观基因组学方面比传统的短读长测序(SRS)还具有几个关键优势
:
(1)LRS可以直接对天然DNA分子进行测序,无需额外的文库制备步骤即可检测DNA甲基化。
(2)由于LRS在单分子分辨率下运行,无需扩增,提供了对表观遗传修饰更加定量和准确的测量。
(3)LRS固有的长读长可以实现单倍型解析数据的定相,从而通过跨越整个单倍型块来区分母本和父本等位基因。
因此,已经开发出使用LRS的新测定法来分析各种染色质特征,包括可及性、蛋白质-DNA相互作用和3D基因组组织(图1)。这也是本综述的主要内容。
图1. 表观基因组分析和染色质相互作用的单分子LRS的策略
DNA甲基化涉及将甲基添加至DNA分子内的核苷酸,分为内源性和外源性甲基化。内源性主要发生在CpG二核苷酸胞嘧啶环的第五个碳处,外源甲基化包括N6-甲基腺嘌呤(6mA)和GpC甲基化。这些修饰均由DNA甲基转移酶催化, 以S-腺苷甲硫氨酸(SAM)为甲基供体。
1.SRS中的间接DNA甲基化检测
DNA甲基化传统上是使用SRS通过专门的文库制备方法,依赖于替代的基因组 DNA预处理,间接检测DNA甲基化信号。SRS的缺点是容易引入各种偏差;只能针对特定的修饰类型;复杂区域精度不足。
2.使用LRS直接检测DNA甲基化
ONT和PacBio LRS技术都能够在测序过程中同时检测DNA甲基化,从而消除单独的文库制备步骤的需要。
通过LRS识别甲基化位点涉及三个主要步骤:特征提取、读数水平预测和位点水平预测。
(1)特征提取:
分析测序信号中甲基化核苷酸引入的修饰;
(2)读数水平预测:
使用计算模型来解释提取的特征并确定单个测序读数中甲基化的存在;
(3)位点水平预测:
使用直接计数或基于模型的方法确定每个基因组位点的甲基化状态。
此外,就检测的种类而言,ONT和PacBio平台都将其功能扩展到检测5mC之外,包括各种DNA修饰,例如6mA和4mC。
图2. 使用SRS和LRS检测DNA甲基化的方法
1.传统检测
传统的核小体占据和染色质可及性的全基因组图谱绘制主要依赖于基于切割和甲基转移酶的检测,并辅以SRS。其中,基于甲基转移酶的检测依赖亚硫酸氢盐转化来检测甲基化标记并推断开放染色质区域。该方法缺点是无法捕获远端可及性的协调并检测这些事件的同时发生;无法准确识别片段重复和HRR处的染色质可及性模式。
2.使用LRS进行基于甲基转移酶的染色质可及性测定
LRS通过沿着单个DNA分子直接检测甲基化标记,消除了DNA扩增和亚硫酸氢盐处理的需要,能提供对跨扩展基因组区域的染色质可及性的更全面和准确的评估。6mA甲基转移酶常用来标记可访问位点,可实现更高的分辨率,同时清晰地区分外源甲基化信号。然而,成本限制使得LRS只能低覆盖范围,阻碍了对细胞子集的遗传改变(例如体细胞嵌合变体)和罕见的表观遗传状态的检测以及对远程复杂印记位点的分析。
图3. 用于分析染色质可及性的SRS和LRS方法
3.分析长读染色质可及性数据的方法
(1)识别单分子读数中的甲基化位点;使用与实验方案中使用的甲基转移酶兼容的碱基识别算法来鉴定6mA或5mC。
(2)寻找核小体定位:甲基化鉴定后,核小体足迹被检测为以147 bp间隔定期出现的修饰碱基模式,表明核小体定位。一旦核小体足迹被定位,它们就被用来识别和分析插入的甲基化区域。
甲基转移酶敏感区域(MSPs)被定义为具有多个甲基转移酶诱导的甲基化位点的区域(通常跨越核小体足迹之间的数百个碱基对),被标记为可接近区域,需要被精确提取。然后下游分析可以识别可访问区域内的蛋白质存在情况,例如 RNA聚合酶(Pol)或转录因子,可以为转录机制和染色质结构之间的动态相互作用提供了新的见解。然而,由于许多转录因子基序的简并性,即使是LRS也很难识别负责给定足迹的特定转录因子。
此外,基于LRS的染色质可及性方法还可用于共驱动分析,即研究一个基因组区域的可及性如何影响沿同一染色质的相邻部分的可及性,通常跨越数千个碱基,从而增强对复杂增强子相互作用的理解。
图4. 基于LRS的染色质可及性分析的数据分析方法
表观遗传学研究通过SRS方法(例如批量ChIP-seq和DamID、MNase-seq、CUT&RUN和CUT&Tag),专门针对蛋白质-DNA相互作用。缺点是:无法测量同一DNA分子上的多个蛋白质结合事件;无法确定单倍型特异性蛋白质-DNA 相互作用的相位或绘制HRR中的相互作用图谱;无法同时检测蛋白质-DNA 相互作用和DNA甲基化。
最近开发了LRS抗体靶向方案来绘制蛋白质-DNA 相互作用图谱,例如直接甲基化测序(DiMeLo-seq)、纳米高分辨率甲基化测序(nanoHiMe-seq) 和BIND&MODIFY等利用融合蛋白内的甲基转移酶活性来识别长、天然、单个DNA分子上的抗体靶向蛋白-DNA相互作用位点。此外,LRS还被用于通过计算每个 DNA分子的组蛋白修饰分数来进行组蛋白修饰的单分子分析,定义为特定基因组内6mA修饰碱基与总腺苷的比率。
图5. 使用SRS和LRS绘制蛋白质-DNA相互作用图谱
将LRS纳入传统的Hi-C,例如C-walk、MC-4C、MC-3C、Pore-C和HiPore-C,能够实现单个DNA分子内涉及的多个基因组位点的复杂染色质相互作用(称为多向染色质相互作用)的检测,提供了三维基因组结构的更全面的视图。
使用ONT和PacBio平台的长读长转录组测定能够对全长RNA分子进行测序,有以下
优点