专栏名称: VG生信软件
国内首家从事Windows平台、可视化生物信息学桌面软件开发的公司。致力于提供领先的生物信息学软件产品和系统服务。产品和业务包括:微生物多样性分析软件、转录组分析软件、重测序分析软件、细菌基因组分析系统。
目录
相关文章推荐
营养师顾中一  ·  这2种「调料」,开封之后必须放冰箱! ·  昨天  
51好读  ›  专栏  ›  VG生信软件

NG|66个水稻泛基因组文献分享

VG生信软件  · 公众号  ·  · 2018-04-10 17:30

正文

Genomes of 13 domesticated and wild rice relatives highlight genetic conservation, turnover and innovation across the genus Oryza 【2018.1.22】

【摘要】

稻属是研究分子进化的模型植物。使用跨越稻属发育树的13个参考基因组,结果显示尽管很少有大规模染色体重排加速物种多样化,却被许多物种特异性新元素的出现和转换所反映,包括转座子,以及潜在的新的编码和非编码基因。研究解决了稻属系统发生有争议的地方,包括两个驯化物种的年轻'AA'亚族中表现在不同染色体间复杂的渗入历史。这项研究强调了功能性偶联抗病基因的流行,鉴定许多潜在用于未来作物保护的新单倍型。最后,随着IR 8'奇迹水稻'完整组装的公布,这项研究标志着现代水稻研究的一个里程碑,它缓解了饥荒并驱动了亚洲的绿色革命。


【结果】

13个基因组数据

两个驯化物种达到了参考基因组水平的组装(IR 8和N22),7个野生物种((Oryza rufipogon, Oryza nivara, Oryza barthii, O. glumaepatula, Oryza meridionalis, Oryza punctata 和L. perrieri)用短的或者长的reads来组装(如下表)。这些组装和其他4个已经发表的基因组用一致的注释方法来减少方法误差。

13 个水稻物种的组装和注释统计



物种树

稻属的系统发育关系是很明确的,但是AA基因组间包括两个驯化物种之间的关系还很模糊,因为很多的基因树不一致。我们使用10个Oryza基因组中的6,015个单拷贝直系同源基因,构建物种进化树,它支持两个独立的粳稻和籼稻的起源。推测的AA物种的年龄小于2.5百万年,之前基因流的足迹在AA物种之间可能仍然是可检测的。



核型保护

泛稻属中多倍化事件引起的水稻中12号染色体核型与其他现存稻属植物相比在水稻中偏差较小。运用同线性图和全基因组比对,我们发现外群L. perrieri有许多小的倒位与O. sativa相比。为了估计稻属中这类事件的发生率,作者重点关注该物种树中至少有两个连续物种共有的倒位事件,同时尽可能减少由于组装错误造成的物种特有的事件。Brachypodium distachyon作为外群,我们确定了9个着丝粒的倒位,长度从60到300 kb,包含多达19个基因(图2).估计这种倒置事件大概160万年出现一次,但是,这个比率并不是恒定的,因为在FF基因组和AA-BB的祖先的分化只有一次事件。

图2 稻属谱系内的染色体倒位事件


TE多样化及迅速消除机制

TEs的选择性扩增和缺失在稻属基因组和染色体进化中起着关键作用。 重复,包括TEs,占基因组的27-50%。 每个物种可以用它长末端重复-反转录转座子(LTR-RTs)的多样性来区分。LTR-RTs的比较注释和系统发育分析鉴定了几个物种特异性的置换爆发,大多数在过去的250万年内。因为它的平均年龄很小,不同物种的LTR-RT是不同的。LTR-RT的快速丢失可以大大降低TE多样性和限制基因组大小增加。在八个最密切相关的AA物种中追踪75个直系同源LTR-RT基因,平均缺失率为3.62kb /百万年的。

这些结果强化了TEs是重要基因组进化的驱动力的概念,因为它们促进基因间区域的快速更新。 然而,并非所有的TEs行为都相同,微型终端重复反转录转座子(TRIMs)

位于基因附近,在所有13种基因组中高度保守。


Indels是基因组进化和驯化的驱动力

八种最密切相关的AA基因组成对比较,根据基因组比较确定了216,059-699,587个indels。与以前在Oryza和Arabidopsis中的情况一致,短indel很受欢迎。为了更好地理解indel动态和在驯化中的作用,我们扩大了这项研究,以包括20个O. glaberrima的栽培种和其19个野生祖先O.barthii。用中等深度重新测序,我们鉴定了O.blaberrima中有162,267个的indel,O.barthii中有448,000个。π在O.barthii(0.622 / kb)中要高于O.blaberrima(0.446 / kb),与O. glaberrima驯化期间的遗传瓶颈和强烈选择一致。实验表明驯化物种中多态性插入子的固定率远高于其祖先。这些观察结果大致类似于观察到的亚洲栽培稻及其祖先的SNP数据。


物种间特有的基因家族

研究确定了21,448个预测的基因家族,可以分为四个年龄段(图3a)。最古老的群体,至少可以追溯到被子植物的共同祖先,包括62%的基因只有29%的家族。

3a

编码长度表现出明显的年龄依赖性,中等长度提升了几倍从最小的增加到最老的。即使排除了被子植物共享的基因外,情况仍然如此(图3b)。观察到的年龄依赖性,在拟南芥中也有发现。当定性评估和定量评估时(图3b),基因表达与年龄呈正相关。再次,在分析中排除来源于被子植物的基因并没有改变这一发现。

图3b







请到「今天看啥」查看全文