专栏名称: VG生信软件
国内首家从事Windows平台、可视化生物信息学桌面软件开发的公司。致力于提供领先的生物信息学软件产品和系统服务。产品和业务包括:微生物多样性分析软件、转录组分析软件、重测序分析软件、细菌基因组分析系统。
目录
相关文章推荐
新疆949交通广播  ·  两男子直播吸毒还自报家门,被举报后半小时落网! ·  昨天  
新疆949交通广播  ·  免费开放! ·  昨天  
Linux就该这么学  ·  开源办公套件 LibreOffice ... ·  昨天  
Linux就该这么学  ·  美女博主爆改 家用空调外机 ... ·  昨天  
新疆949交通广播  ·  出现这些情况可能是流感重症!警惕→ ·  3 天前  
51好读  ›  专栏  ›  VG生信软件

动物基因组起源进化新研究

VG生信软件  · 公众号  ·  · 2017-09-15 16:00

正文

多细胞动物基因组是怎么形成的?目前这还是一个未解之谜。


大约六亿年前,一些单细胞的生物,开始具备了协同分工的能力,最终形成多细胞生物;而这个重要的进化过程,通常认为不是一次发生的,而是不同时间在生命之树的不同节点处分别各自发生,从而形成了现在的动物、植物、真菌、藻类等分支。其中动物可以说是地球上最为复杂的物种类型,其基因组一般相对较大,具有较多数量的内含子,而且不同种类的动物,其基因组大小可能相差很大,小的只有几十兆,大的超过100 G。


麻雀虽小,五脏俱全,多细胞动物的单细胞祖先物种,其基因组也不简单,已经拥有了很多现在在多细胞动物基因组中起着协调细胞活动的基因。所以,深入研究单细胞动物的基因组,看它们是否具备多细胞动物基因组的一些共同特点,对于了解一些特定遗传特征的进化机制,以及在动物物种起源中扮演何种角色,是非常有用的。


近期国际知名刊物eLIFE发表了一篇由西班牙、法国、美国、日本等国科学家合作完成的研究工作,该研究使用高通量测序技术,新完成了4个单细胞物种的全基因组测序,而这些物种可以说都是动物最近的单细胞祖先(都属于动物总界,holozoa)。现在我们就来看看,这篇论文有什么新发现吧。动物总界,包括蜷丝生物(Filozoa)和中粘菌(teretosporea)两大主要分支,蜷丝生物又包括后生动物、蜷丝球虫(filasterea)、领鞭毛虫(choanoflagellatea)等类型,中粘菌又分为鱼孢霉(Ichthyosporea,或名mesomycetozoa)和珊瑚壶菌(corallochytrium)两大类。本研究中新测序了三种鱼孢霉:Chromosphaera perkinsii,Pirum gemmata ,Abeo forma whisleri,以及一种珊瑚壶菌:Corallochytrium limacisporum。再加上此前已测序的三种鱼孢霉:Creo limax fragrantissima,Ichthyophonus hoferi,Sphaeroforma arctica,两种领鞭毛虫(Salpingoeca rosetta,Monosiga  brevicollis),和一种蜷丝球虫(Capsaspora owczar zaki ),一共10种属于动物总界的单细胞生物,一起进行比较基因组研究和进化分析。新测的4个基因组中 ,Chromosphaera perkinsii和Corallochytrium limacisp orum基因组都比较小,分别为34.6M和24.1M,但拼接质量较高,scaffold N50分别在120kb和180kb,前者预测得到基因数为12463个,BUSCO评估基因组完整度在85.5% ;后者基因数7535,基因组完整度83.4%。相比之下 ,Pirum gemmata和Abeoforma whisleri的基因组更大,但拼接质量较差,各自包括2万多个scaffold,基因组完整度不到20%。


1


后生动物的基因组一般都较大,即使是像海葵、海绵这样相对低等的后生动物,基因组大小也在300-500M之间。相比之下,单细胞原生动物的基因组就紧凑得多,Chromos phaera ,Corallochytrium和Capsaspora的基因组都只有25-35M,但也并非所有原生动物的基因组都这么小,Sphaeroforma, Abeoforma, Pirum和 Ichthyo phonus都在84-121M之间,因此研究人员推测,动物从单细胞进化到最初的多细胞状态,至少经历过两轮基因组扩张事件,而这种扩张的驱动力,就是大量重复序列的插入,因为Sphaeroforma ,Abeoforma, Pirum和Salpingoeca基因组中,转座子的拷贝数确实比Corallochytrium和Capsaspora高出数十倍。


众所周知,包括动物在内的各种真核生物,和原核生物的一个主要区别就是,基因组中含有不会被表达成蛋白质的内含子区域。因此,解析低等的单细胞动物基因组,就为我们研究内含子的进化提供了丰富的素材。如图2所示,本研究发现,鱼孢霉、领孢子虫、后生动物等,一般内含子数目都相对更多,而且几种鱼孢霉中内含子长度接近后生动物。两种不同的进化途径可能导致这样的结果,第一种可能,内含子的产生和爆发发生在动物总界起源之时,然后在某些进化分支(如Cora lochytrium和Capsaspora)发生了收缩;或者第二种可能,鱼孢霉、领孢子虫、后生动物各自独立发生了内含子扩增事件。通过对来自40个基因组的泛真核生物直系同源基因内含子位点保守性研究,第二种可能性得到了更高的证据支持,自从在真核生物的最近共同祖先(LECA)基因组中开始出现内含子,在大多数进化分支上的状态都是内含子丢失、不发生变化或者变化的结果是动态平衡,显著例外的,或者说内含子扩增的三个主要爆发点:就是后生动物起源之时,后生动物和领鞭毛虫共同祖先,以及Ichthyophonida(鱼孢霉下的一个目,包括此前测序的3种鱼孢霉)起源时(图3)。


2

3

内含子数目的增加,就为物种提供了更加丰富多样的可变剪切可能性,从而有利于产生更多不同的蛋白。对于由于某种变异而提前产生终止密码子的mRNA转录本,细胞可以通过无义介导的衰变(nonsense mediated decay, NMD)机制来控制其表达量。至于内含子和外显子的边界(俗称“剪切位点”),通常其识别是由富含丝氨酸和精氨酸的蛋白质来完成的(简称“SR机制”)。研究表明,参与NMD 和SR机制的基因,也确实在上述几个内含子爆发的进化分支的最近共同祖先中都保守。








请到「今天看啥」查看全文