自circRNA首次在拟南芥中报道后,植物circRNA中的研究便拉开序幕。今天要分享的文章是一篇早期植物circRNA鉴定的文章,题目是Widespread noncoding circular RNAs in plants。该篇文章发表于New Phytologist(影响因子7.33),ISI期刊引文报告排名:9/211(植物科学)。
1
.早在上世纪,陆续有报道显示真核细胞中环状 RNA 的存在,但在当时被认为是剪切错误的产物。随着高通量测序技术和生物信息学分析的发展,Salzman 等人首次指出环状 RNA 由 mRNA 前体可变剪切得来,是一类 3’ 与 5’端共价闭合,广泛大量存在于真核生物体内的内源性RNA,参与转录后调控过程。
2
.circRNA形成的模型如图1所示,在转录过程中发生head-to-tail splicing (back splicing),当剪切体两端自身发生互补配对时,则转录出circRNA。
3
.根据来源,circRNA可以分为三类:外显子、内含子和基因间区域circRNA.
4
.在人类的研究中,circRNA环化过程具有以下特征:
a.相邻长的内含子序列中通常富集ALU重复片段.
b.侧翼内含子具有反向互补的特征.
c.RNA结合蛋白Quaking参与调控circRNA的形成。
5
.circRNA能够组织时空特异性表达,且能够通过miRNA sponges实现调控功能。
Fig 1 A model showing linear and back splicing for generating linear mRNA and circRNA, respectively.
1
.数据来源:O. sativa根部(GenBank accession PRJNA215013; read length 101 bp);A. thaliana叶片(PRJNA218215; read length 100 bp).
2
.使用 BOWTIE2 (v2.0.5)获得未比对到参考基因组上的RNA测序序列,提取首尾20-nt再次比对到参考基因组找寻唯一的接头(anchor)位置,并通过侧翼剪切位点GU/AG来确定circRNA的候选序列。每一个候选circRNA至少包含两个独立的反向剪切序列。(图2)
Fig 2 The pipeline for computational identification of circRNAs in plants following the method used in animals (Memczak et al., 2013)
3
.circRNA的实验验证:简单来说,作者通过发散性引物(divergent primers)在DNA和cDNA模板上扩增信息的不同来验证circRNA的存在。PCR条件详见文章。值得一提的是,实验对象是参照下载数据的文章所述相同条件和部位。同时,为了验证下载数据的真实性,作者采用相同条件种植水稻,并取相同部位进行扩增实验。
4
.Blast用于序列保守性分析,GO富集分析用于序列功能注释,MEME用于侧翼内含子中5-60nt 保守基序的鉴定。
5
.表达分析采用FPKM算法计算,通过Pearson correlation coefficien判断circRNA与来源基因的共表达相关性。
结果:
1
.对鉴定的数据进行描述,包括circRNA的数量、来源分类,见表1。水稻和拟南芥中有 12037 和 6012 个环状 RNA,其中外显子circRNA数量较多。同时,作者从中随机选取 (10/18) 个高表达的外显子circRNA进行PCR扩增实验结果验证测序结果。
Table 1 Genome-wide identification of circular RNAs (circRNAs) in plants based on RibominusSeq data
UTR, untranslated region
aOther circRNAs refer to those derived from two or more genes.
2
.比对分析了水稻和拟南芥中鉴定circRNA的同源性,其中直系同源对数目超过700,其中超过 300 个直系同源亲本基因的环状 RNA 均来自于基因组相同位点,如图3例子所示。
Fig 3 An example showing conservation of exonic circRNAs.
3
.根据动物circRNA研究基础,分析植物中circRNA侧翼序列结构特征,发现植物外显子circRNA侧翼内含子序列并不富含重复和反向互补序列。同时,在水稻和拟南芥的circRNA中,未发现保守的侧翼内含子序列。相较于动物,植物circRNA侧翼内含子要长于线性基因的。
4
.磷处理下水稻根部circRNA表达与其来源基因的相关性分析发现349对具有显著正相关,且暂未发现呈负相关的组合。不同处理下的水稻circRNA的表达不尽相同,说明其表达具有一定时空特异性。其中,27个外显子circRNA在响应磷胁迫中发挥功能。
5
.通过对产生circRNA的基因组区域是否包含miRNA结合位点来预测circRNA分子靶miRNA,发现只有小部分的circRNA分子具有miRNA结合位点,其中水稻5.0%,拟南芥6.6%.
作者选用植物中最基本的研究对象展开circRNA的研究,涵括单子叶及双子叶植物,通过对比动物研究,初步得到植物circRNA同样具有特异性时空组织表达的特性,其表达与来源基因相关,且序列保守。但在circRNA形成模式上,植物与动物间的特征并不相同,如侧翼序列的重复片段、内含子长度等方面。结果显示,circRNA在植物生长过程中同样起到重要作用,值得深入研究。
该篇文章把握了当下研究热点,为植物
circRNA
的鉴定研究提供了一个研究模板。下一篇我们将继续分享
NP
中发表的另一篇
circRNA
研究的文章,学习优秀文章的研究策略。
PS:发送“5.16文献”获取文献~
本文为生信草堂原创,欢迎个人转发分享,其它媒体或网站如需转载,请在正文前注明转自生信草堂并联系bioinformatics88
circRNA及其数据库
circRNA识别中实验准备及生信分析的挑战
ERβ如何介导的circRNA调控