茶是自从公元3000年前世界上最为古老也是最为广泛饮用的含咖啡因软饮料。目前,世界三大饮料植物中的咖啡和可可的基因组已经相继被欧美国家完成了测序,只剩下茶树的基因组尚未被破译。近日,在中科院昆明植物研究所高立志团队带领下,由广东省农业科学院农业生物基因研究中心、华南农业大学、云南农业大学等多家单位协作攻坚,共同攻克了茶树高杂合、高重复和基因组庞大的植物基因组测序的难题,率先破译了茶树基因组并揭示茶叶风味、适制性及茶树全球生态适应的遗传学基础,该成果以“The tea tree genome provides insights into tea flavor and independent evolution of caffeine biosynthesis”为题于5月1号在线发表在Molecular Plant杂志上。茶树高质量基因组图谱的成功绘制揭示了决定茶叶适制性、风味和品质以及茶树全球生态适应性的遗传基础,必将大大地加速茶树功能基因组学研究和优异新基因发掘,加快旨在提高茶叶品质和适应性的茶树新品种培育。(文章链接:http://www.cell.com/molecular-plant/abstract/S1674-2052(17)30103-X)
该研究获得了栽培茶树大叶茶种(Camelliasinensisvar.assamica)云抗10号约30.2亿碱基对的高质量基因组参考序列,注释得到36,951个蛋白编码基因。研究表明,茶树基因组中重复序列含量极高,约占整个基因组的80.9%;在过去的5,000万年以来,茶树基因组中长末端重复序列反转录转座子家族经历了多次大量的爆发,加上它们长期而缓慢地扩增但缺少有效的DNA删除机制,导致茶树基因组变得十分庞大;研究发现最大的长末端重复序列反转录转座子家族约占茶树基因组的36.79%,这是单个长末端重复序列反转录转座子家族在植物基因组里扩张和生存长达5,000万年的首次报道。
图1茶树基因组中LTR逆转录转座子的进化
茶树所在的山茶属植物多达100余种,一个重要但长期困惑的问题是为什么只是茶组植物的叶子适合制茶而非茶组植物诸如我们熟知的茶花、油茶和金花茶等的叶片不作为茶饮。对大多数茶组植物和非茶组的代表植物共25个山茶属物种中决定茶叶适制性和品质的三个主要的特征性成分(儿茶素或茶多酚、茶氨酸和咖啡因)进行了植物化学成分比较分析,发现茶树和其它的茶组植物富含茶多酚和咖啡因而区别于非茶组物种,比如茶多酚中的特征性成分(EGCG,EGC,C,EC和ECG)的含量在茶组物种之间差别很大但显著地高于非茶组物种,而茶氨酸含量没有显著差别,说明高含量的茶多酚和咖啡因决定了山茶属植物能否适合制茶和茶叶风味。
图2茶树基因组和基因家族的进化
基于茶树基因组里获得的与茶多酚、茶氨酸和咖啡因生物合成相关的基因序列,我们的比较基因组学研究发现茶组与非茶组物种共同地拥有与茶叶特征性成分生物合成相关的基因,说明了茶树的三大特征性成分的生物合成途径约在6.3百万年前在山茶属植物的共同祖先里就已形成并且高度保守至今。我们进一步的比较转录组学研究发现,与茶多酚和咖啡因生物合成相关的关键基因在茶组植物中的表达水平显著地高于非茶组植物,但是与茶氨酸生物合成相关基因的表达模式在两者之间则无明显区别,说明了茶多酚和咖啡因代谢通路相关基因的不同表达模式决定了山茶属植物作为茶饮的适制性、茶叶的品质和滋味;茶多酚和咖啡因代谢通路相关基因表达的巨大差别导致了茶组不同物种中茶多酚和咖啡的不同富集进而形成了多种多样的茶叶的风味。我们发现,茶树的野生近缘物种厚轴茶含有非常高的茶多酚但是极低的咖啡因,具有培育茶树新品种的巨大潜力,茶组中的栽培茶树的野生近缘物种因蕴藏着丰富的优异新基因,是未来茶叶品质改良的巨大宝库。
图325种山茶属植物植化成分和比较转录组学研究
茶树高质量基因组图谱的成功绘制揭示了决定茶叶适制性、风味和品质以及茶树全球生态适应性的遗传基础,必将大大地加速茶树功能基因组学研究和优异新基因发掘,加快旨在提高茶叶品质和适应性的茶树新品种培育。