专栏名称: 药用植物研究前沿
药用植物研究前沿是一个聚焦中药材、药用植物、具有药理作用天然产物的自媒体平台,致力于分享最新的科研动态、研究方法和学术成果,通过科普知识,法规指南,技术革新,招聘信息等板块深度报道行业进展,努力构建最专业的中药学、药用植物学学术传播平台。
目录
相关文章推荐
生活小帮办  ·  吉林省最新任免一批干部! ·  3 天前  
吉林果粉天天报  ·  吉林市预警!寒潮!温将下降8~10℃ ·  3 天前  
吉林果粉天天报  ·  吉林市预警!寒潮!温将下降8~10℃ ·  3 天前  
吉林省商务厅  ·  2025年“首发吉林”系列活动全面启动 ... ·  3 天前  
吉林省商务厅  ·  2025年“首发吉林”系列活动全面启动 ... ·  3 天前  
51好读  ›  专栏  ›  药用植物研究前沿

【中药资源】2020全年发表的200篇动植物基因组高分文章集锦

药用植物研究前沿  · 公众号  ·  · 2021-01-08 09:45

正文

前两周,我们回顾了2020年泛基因组的研究进展( 年终盘点丨2020必读的10篇经典泛基因组文章 ),并展望了泛基因组今后的发展趋势。但纵观概览,泛基因组只是基因组学中较小的一部分,要洞察后基因组学的研究热点,有必要对2020全年发表的基因组文章进行系统总结。


通过Web of Science、NCBI、谷歌学术、期刊官网搜索,结合植物学领域相关公众号的全年报道,共获取了与动植物基因组相关的文献 308 篇(发表时间2020.01-2020.12)。通过筛选,我们选取200篇高分文章( 植物基因组130篇,动物基因组70篇 ),从发表期刊、时间、物种分类、物种倍性、基因组大小、组装技术、组装指标、组学技术、生物学故事等9个方面来进行系统总结,以期能全面还原2020基因组学的“研究偏好性”。


01 发表期刊

2020全年共有37本学术期刊发表过动植物基因组文章,在剔除小样本及冷门期刊后,我们保留了24本期刊,包括BMC Biology、Cell、Communications biology、Current Biology Genome Biology、Gigascience、Horticulture Research、iScience、Molecular Biology and Evolution、Molecular Ecology Resources、Molecular Plant、National Science Review、Nature、Nature Biotechnology、Nature Communications、Nature ecology&evolution、Nature genetics、Nature Plants、New Phytologist、Plant Biotechnology Journal、PNAS、Science、Science Advances、The Plant Journal等,各期刊全年基因组文章发表的情况如下所示。

图1  2020年各期刊基因组文章发表情况


从图中可看出,NC、 Horticulture Research Gigascience 占据了基因组文章发表数目的前三位,累计占比达到了40%,这说明上述期刊是基因组领域的“热门期刊”;CNS主刊共发表基因组文章12篇,占比不到5%,说明其发文难度仍然很大,而2020其发表的诸如小麦、蝙蝠、大豆等基因组文章皆为经典文章,引用率均超百次;另外,植物学领域著名期刊PBJ、NP、MP、PJ等基因组文章平均刊发数量均超过10篇,比2019年提升10%,这也值得重点关注。


而从影响因子来看,2020全年基因组文章累计IF达到2300,其中80%以上的文章IF集中在5-15分,5分以下和15分以上的仅占比5%和12%,这表明“灌水”论文显著减少,“高精尖”文章显著增加。

图2  2020年基因组文章影响因子分布情况


02 发表时间

我们以月份为统计单位,绘制了2020全年每月的基因组文章发表情况。结果表明,1-12月份月发文数量最高不超过25篇,最低不低于8篇,集中在15-20篇;从时间维度来看,下半年基因组文章数量占据全年的60%,这说明2020下半年基因组研究人员的热情最为高涨。总的来说,基因组文章在每个月中均有发表且无显著差异,但下半年投稿发文运气可能会更好。

图3  2020全年每月的基因组文章发表情况


03 物种分类

上述提到,我们从2020基因组文章中选取了植物基因组130篇, 动物基因组70篇。具体到物种分类来看,动物基因组研究的热点集中在哺乳动物、昆虫、鱼类与软体动物,这四类物种占动物基因组文章数量的80%;植物基因组集中在作物、林木、水果、中草药与蔬菜类,这五类占比达到植物基因组文章数量的75% 。这表明,有经济价值、营养价值与多用途的物种仍是基因组研究的“明星物种”。

图4  2020发表的基因组文章物种分类统计图


为进一步体现基因组学研究者的“物种偏好性”,我们对200篇文章进行了频数分布统计,结果表明研究最热的植物依次是 大豆(6)、小麦(5)、玉米(4)、茶树(4)、葡萄(4)与紫花苜蓿(4) ;研究最热的动物依次是 人(6)、牛(5)、猴(3)与金鱼(3)


04 物种倍性

由于自然选择与物种的不断进化,全基因组加倍事件在动植物中普遍存在,这使得从基因组学来研究多倍体的“故事”变得越来越有趣。我们以二倍体为参照,统计了2020全年被解析的多倍体物种,具体情况如表1所示。

表1  2020发表的多倍体基因组

从表1可看出,2020全年共解析将近20个多倍体基因组,其中植物占据85%,集中在异源四倍体,涉及的物种包括草本植物、作物等;而动物中,全部都是异源四倍体,且全都是鱼类。据此预测,2021年多倍体物种基因组文章或超过30篇。


05 基因组大小

以文章最终组装的基因组大小为依据,对200个物种的基因组大小进行统计。结果表明, 2020发表的基因组大小范围为108Mb(条斑紫菜)~16.24Gb(大蒜),横跨范围非常大;具体来看,500M以下基因组占比32%,500Mb~1Gb占比30%,3G以上的大基因组占比9% 。这说明,2020科研人员测序组装的物种仍是以1G以下的小基因组为主,但随着诸如HiFi测序技术的发展,超大基因组的破译将进入黄金时代。

图5  2020组装发表的物种基因组大小统计图


06 组装技术

组装技术通常分为两类,一类为测序技术,另一类为辅助组装技术。前者包括Illumina、BGI、PacBio、Nanopore,后者包括Hi-C、10×Genomics、Bionano、Chicago等,通过统计分析我们得出如下结论。

(1)2020全年发表的基因组文章中,以二代为主的组装技术占比仅为10%,而三代为主的组装技术占比超过90%,这足以说明三代测序是基因组发文的标配技术。

(2)以三代测序为主的2020基因组文章中,PacBio测序占比达到77.7%,Nanopore测序占比仅为23%,即PacBio的发文数量是Nanopore的3倍之多,这表明PacBio测序在基因组文章中占据主要优势。

(3)在辅助组装技术中,Hi-C占据绝对优势。2020使用辅助组装的基因组文章中,Hi-C占比达到90%,而10×Genomics、Bionano、Chicago技术占比不到10%。


综上,PacBio+Hi-C仍将是2021年基因组文章的主力军。

图6  测序和辅助组装技术在2020基因组文章中的占比情况


07 组装指标

0 Gap基因组是研究人员的终极梦想,在通往梦想的旅途中,连续性好、准确性高的参考基因组往往能起到指明灯的作用。2020年,组装连续性最好的动物基因组为恒河猴基因组(除人外),其Contig N50达到了46Mb;而连续性最好的植物基因组为玉米基因组,其Contig N50达到了惊人的162Mb;Contig N50小于1Mb的占比为13.6%,而85%以上的物种Contig N50都超过了1Mb。此外,93%的物种都组装到了染色体水平,更有两个物种组装出端粒到端粒的水平(人、水稻)。

图7  2020组装指标较好的动植物基因组(部分)


08 组学技术

后基因组时代中,多组学的联合应用能更充分挖掘物种的遗传信息。我们对2020的基因组文章所用组学技术进行统计,结果表明, 单纯应用比较基因组学的文章占比为18%,加上成文快、审稿短等特点,2021年单纯的比较基因组学文章仍会有一席之地;而在所有组学中,转录组堪称基因组的“黄金搭档”,42%的文章主体都使用了基因组+转录组,且还有39%的文章都使用了转录组来辅助验证;重测序(包含GWAS、群体进化、QTL、结构变异检测)在2020基因组文章中也得到广泛应用,其占比达到了24%,且鉴于越来越多的基因组被测序发表,2021“基因组+重测序”思路的文章占比会得到进一步提升 。此外,代谢组&蛋白组、三维基因组等新兴技术与基因组学的融合(占比10%),使得基因组文章更具可读性。

图8  2020基因组文章所用组学技术统计情况


09 生物学故事

基因组高分文章的核心在于能完整、清晰地讲述物种的“具体生物学故事”,我们回顾了2020年基因组文章的主要关键点,发现科研人员的研究热点集中在如下区域。


(1) 阐述物种分类地位、起源进化(如茶树、藻类、驴、金鱼等)

(2) 解析次生代谢物的合成通路(如雷公藤、元宝枫、大蒜等)

(3) 解析环境适应性(如高原鳅、小麦、羽扇豆等)

(4) 重要、特殊表型的调控和形成机制(如茄子、紫花苜蓿、棉花、鳞脚蜗牛等)

(5) 性别决定机制、Hox基因、寄生、共生等生长发育现象研究(如杨树、葡萄、蚯蚓企鹅等)

(6) 结构变异、基因分型(如小麦、大麦、玉米、牛、人等)


总结

在每年多达几百篇的基因组文章中,存在着极强的规律性与可复制性,例如比较固定的投稿期刊、写作模式、研究思路、方法技术等,而总结与运用这些特性可以使我们的科研工作更加游刃有余。因此,我们有理由相信,上述的9点分析在2021年基因组文章中也会继续上演!最后,我们将2020全年的200篇基因组高分文章进行汇总,以期能给广大研究者更多启发!








请到「今天看啥」查看全文