基因组、转录组和代谢组学分析百香果的进化和风味合成研究
期刊:
Horticulture Rasearch
时间:
2021.1
IF:
5.404
2021年1月,中国热带农业科学院在Horticulture Rasearch发表了名为“Chromosome-scale genome assembly provides insights into the evolution and flavor synthesis of passion fruit (Passiflora edulis Sims) ”的研究论文。
本研究是基于代谢组、基因组和转录组学技术,对百香果的基因组进行了组装,并分析了百香果三个不同发育阶段代谢物的积累模式和基因表达模式,为百香果遗传改良提供新的见解。
迈维代谢提供了挥发性代谢物检测服务。
百香果是一种经济价值很高的水果,生长在世界的热带和亚热带地区。百香果具有很高的药用和观赏价值。据报道,从叶子、果实、果皮和种子中提取的提取物含有C-糖基黄酮类化合物,包括牡荆素、异牡荆素、荭草素、异荭草素、木犀草素、芹菜素、山奈酚和其他具有镇静、抗氧化、抗炎、抗焦虑和抗癌作用的活性物质。就观赏价值而言,大多数百香果花器官大,冠丝明亮,泌蜜结构精细,香气浓郁,枝叶繁茂;因此,它们被用作观赏植物、树篱和花架。百香果的转录和基因组信息的缺乏限制了该物种的遗传和育种研究;因此,需要更详细的分子和基因组资源来彻底研究百香果物种的遗传多样性。在本研究中,作者组装了一个高质量的百香果基因组,并对基因组进化和风味合成的潜在机制进行了详细的分析,为百香果的遗传研究和改良奠定了坚实的基础。
百香果是世界上种植最广泛的品种,其花冠大而漂亮(图1a),果皮紫色,果肉黄色(图1b);因此,我们选择它进行测序和组装。
我们通过K-mer分析估计紫色百香果的基因组大小为1395.76 Mb
。使用各种方法评估了组装的完整性和准确性。首先,在基因组组装中发现了超过91.56%的BUSCOs。第二,大约84.85%的来自果实发育不同阶段的RNA-seq数据与基因组装配相匹配。第三,将组装序列与第二代和第三代数据进行比较,映射率和覆盖率分别为98.74%和95.47%,99.99%和99.95%。
图1. 百香果的形态学和百香果基因组概述
使用AUGUSTUS对基因组进行注释,从三个样本中收集从头预测和转录组数据,在百香果基因组中产生23,171个蛋白质编码基因。鉴定出的基因数量少于其他密切相关的物种,如毛果杨、蓖麻和可可,它们分别有51,717、28,584和30,854个基因。在23,171个基因中,22,261个(96.1%)被分配到一个染色体位置。这些基因沿染色体分布不均匀,对末端有明显的偏好(图1c)。在百香果基因组组装体中总共鉴定出994,414个重复元件,表明大部分组装的基因组是重复的。这些重复元件沿染色体分布不均匀,对着丝粒有明显的偏好(图1c)。
使用OthoMCL31在百香果和其他19个物种中鉴定了独特和共有的基因家族:百香果、木薯、酿酒葡萄、蓖麻和橡胶树共有8429个基因家族;百香果、窄叶羽扇豆、西瓜、菜瓜和苹果共有7834个基因家族;百香果、圣女果、甘蓝型油菜、拟南芥和龙舌兰共有7449个基因家族;和百香果、二穗短柄草、水稻、玉米、二色五味子共有7924个基因家族(图2b)。
利用一组单拷贝基因家族构建了系统进化树,表明百香果与十字花科(蓖麻、橡胶树、木薯)所包含的大戟科植物亲缘关系最近,与其他植物亲缘关系较远
(图2a)。此外,百香科植物在8000万年前从大戟科的共同祖先分离后独立进化而来。这种系统发生树与以前研究中观察到的物种关系一致。
为了阐明百香果何时经历了全基因组复制,在葡萄、甘薯和百香果中发现同义替换(Ks)。同源基因对的峰值Ks为0.6(图2b),表明百香果中发生了全基因组复制(WGD)事件。WGD事件估计发生在约65 MYA(图2b),表明WGD事件发生在百香果和大戟科植物分化之后(图2b)。相比之下,百香果基因组同源基因对的峰值Ks为0.1,这表明另一个WGD事件估计发生在约12 MYA。这一结果与进化树一致。
基因间分析显示百香果基因组的染色体之间存在不同的线性关系,共鉴定出5545个共线基因对(图1c)。百香果和葡萄以及甘薯之间的基因间分析揭示了高度保守的共线性,这支持了这些植物之间的密切进化关系。百香果的9条染色体都与18条甘薯染色体有很强的对应关系。其次是19条葡萄染色体(图2c)。总的来说,我们在百香果和葡萄以及百香果和甘薯之间分别鉴定了14,467和21,210个共线基因,表明百香果基因组的62%和91%与这些植物共线。此外,在一些重要的基因(ADH、FAD和EHL)中,我们可以看到这三个物种的共线性(图2c)。
结果进一步表明百香果祖先物种中可能存在染色体融合或祖先物种中可能存在染色体分歧
。
2、代谢组分析
:百香果发育阶段的代谢差异及风味物质的积累
为了了解果实发育过程中挥发性有机化合物差异的分子机制,收集了三个不同发育阶段的果实(图3a)。代谢分析显示共发现有142种代谢物,包括酯类、萜类、酸类和醇类。为了比较百香果果实发育过程中代谢产物的组成,对气相色谱-质谱数据进行了主成分分析。在PC1 × PC2评分图中,三个样品中的代谢物组成明显分离。第一主成分(PC1)和PC2在T1、T2和T3样本之间明显分离(图3b)。主成分分析很容易区分T1、T2和T3,PC1和PC2分别解释了总方差的46.25%和26.82%。
水果的风味品质主要涉及糖和有机酸参与碳水化合物代谢。不同代谢物的含量和类型可能在确定百香果的风味中起着至关重要的作用。
这三个时期样品在糖、有机酸和酯的积累方面表现出差异
。我们在T1和T2之间、T1和T3之间以及T2和T3之间分别鉴定出总共50、105和97种不同的代谢物(图3c)。总体而言,大多数代谢物在T3的水平高于T1和T2,在T2的水平高于T1(图3c)。在T2和T1之间,44种代谢物的含量增加,而6种代谢物的含量减少;在T1和T3之间,99种代谢物的含量增加,而6种代谢物的含量减少;在T2和T3之间,88种代谢物的含量增加,而9种代谢物的含量减少(图3d)。
利用KEGG数据库对差异代谢物进行注释,结果显示这些途径主要富集在以下方面:“代谢途径”、“硫辛酸代谢”、“脂肪酸生物合成”、“次级代谢物的生物合成”和“α-亚麻酸代谢”
(图3e)。
对百香果的三个发育阶段进行转录组测序、聚类和DEGs转录组测序的功能富集
。发现超过19,224个注释的基因。在所有样本中,基于|log2Fold Change | ≥ 1和FDR < 0.05,使用DESeq2共鉴定出10693个DEGs。其中,在T1和T2样品的转录组之间鉴定了3715个基因组(1571个上调,2144个下调),在T1和T3样品之间鉴定了9405个基因组(3405个上调,6000个下调),在T2和T3样品之间鉴定了6979个基因组(2259个上调,4720个下调)。在这三个组中还发现了1755个共同的DEGs和152个共同的差异表达的TFs(图4a,b)。
为了分析DEG表达模式,对不同阶段的表达数据进行集中和标准化,然后使用K-means进行聚类。基于基因表达模式,果实中三个阶段的DEGs分为六个分类。在三个样品中分类4和5显著富集(图4c)。在三个样品中,亚类1和3中的基因表达上调,而亚类4和5中的基因表达下调。
我们还使用KEGG来富集DEGs。在T1和T2之间,
通路“代谢途径”、“次级代谢物的生物合成”、“淀粉和蔗糖代谢”和“脂肪酸生物合成
”被显著富集(q值< 0.05)。
通路“果糖和甘露糖代谢”、“代谢途径”和“次级代谢物的生物合成”
在T1和T3之间显著富集。相比之下,在T1和T2之间,两条途径,“植物激素信号转导”和“次生代谢物的生物合成”被显著富集(图4d)。这些代谢途径为百香果不同果实发育阶段的代谢过程提供了见解。
图4. 百香果发育过程中的基因表达模式和KEGG富集分析
来自不同阶段百香果的转录组和代谢组数据的主成分分析显示了样品之间的显著差异
(图3b)。同时进行差异代谢物和DEGs的KEGG富集分析,结果显示在三个比较中(T1对T2、T1对T3和T2对T3),显著富集的途径是“α-亚麻酸代谢”,“代谢途径”和“次生代谢物的生物合成”。使用R语言包计算各组中DEGs和差异代谢物的皮尔逊相关系数(PCCs),并且各组中PCC > 0.8的代谢物的差异倍数显示在九象限图中。T1与T2相比,总共为2908 DEGs和61种代谢物,7753 DEGs在第三和第七象限检测到T1对T3的129种代谢物,T2对T3的6593种和112种代谢物。基因表达和代谢产物的差异模式是一致的,表明代谢产物的变化可能受到基因的正向调节。此外,差异相关分析(PCC > 0.8)显示,3715 DEGs与T1和T2的23种代谢物相关,9406 DEGs与T1和T3的54种代谢物相关,3715 DEGs与T2和T3的49种代谢物相关。
植物挥发性有机化合物是次生代谢产物,对水果的风味起着重要作用。
在百香果中,挥发性有机化合物主要包括酯类、醇类、萜烯类、醛类和酸类。在代谢组学分析中,检测到142种挥发性化合物,其中63种在三个样品中共有
。这些化合物显示出T2对T1的倍数变化在0.23和8.8之间,T3对T2的倍数变化在0.21和10437之间,T3对T1的倍数变化在0.21和10437之间,表明许多挥发性化合物的水平在T3期间急剧增加。在上调的代谢物中,有四种化合物在T3中比T1增加了100多倍,即己酸1-甲基己基酯(10437倍)、己酸乙酯(3896倍)、丁酸乙酯(1154倍)和丁酸1-甲基辛基酯(144倍)(图5h),它们都是由脂肪酸代谢途径合成的酯。此外,仅在T2和T3中存在26种化合物(其中12种为酯),仅在T3中检测到44种化合物,其中22种为酯(占T3样品中化合物总数的一半)。这些结果表明酯类是百香果的主要芳香成分。此外,在检测到的代谢物中,一些萜烯含量很高,在三个测试样品中变化显著,包括芳樟醇,(E) - 4,8-二甲基ona-1,3,7三烯-3-丁烯-2-酮,萜品烯-4-醇,和4- (2,6,6-三甲基-1-环己烯-1-基)(也称为β-紫罗兰酮)(图5g)。因此,我们得出结论,
萜烯也是百香果挥发性有机化合物的重要成分。因此,酯和萜合成的关键基因在这里被鉴定。
酯主要通过脂肪酸途径合成,我们在该途径中鉴定了13个重要的基因家族
(图5a)。大多数基因位于1号、5号和6号染色体上。我们发现ACX、ADH、ALDH、FAD和HPL基因家族有大量成员:分别为20、41、25、56和33。此外,与拟南芥、木薯和水稻相比,这些基因可能经历了基因扩增,增强了产生酯的能力(图5b),并且在ADH基因家族中也发现了三个串联重复单元(图5d)。另一方面,我们发现许多应激相关和防御相关的顺式元件位于多动症基因家族的启动子区(图5f)。我们还通过比对百香果和拟南芥的ADH蛋白构建了系统进化树,以确认百香果中ADH家族蛋白的分类。阐明了百香果的ADH成员和拟南芥的ADH成员在同一亚组中的功能。表达分析表明,随着果实的发育,PeACX13/14/15/20、 PeADH13/26/33、PeALDH1/4/21和 PeHPL4/6的表达水平增加,与酯代谢物含量的增加趋势一致(图5h),而PeFAD13/50/52/53/55的表达水平逐渐降低。同时,其他基因家族也有代表,包括AAT(6种蛋白质)、ACP-AP(8种蛋白质)、PDC(4种蛋白质)、CYP (16种蛋白质)、EHL (15种蛋白质)、FAE(8种蛋白质)、FAH(2种蛋白质)和LOX (18种蛋白质)。表达分析还表明,一些基因随着果实的发育而发生变化,如PeLOX5/18、PePDC3、PeFAE6、PeFAH2、PeCYP7/13、PeEHL13/15、PeAP-AP1/5/6/7和PeAAT3。这些基因,尤其是ADH基因,可能在酯的代谢中起重要作用。
萜烯代谢物主要由萜烯代谢途径产生,我们在该途径中鉴定了八个重要的基因家族(图5a)。大多数基因位于染色体4、6和8上。成员最多的家族是TPS基因家族,有41个成员。在萜烯合成中可能起关键作用的TPS的量与拟南芥、水稻和木薯中的相似(图5b)。在TPS-b亚家族中也发现了两个串联重复单元(图5c)。另一方面,我们发现许多胁迫相关和防御相关的顺式元件位于ADH基因家族的启动子区(图5e)。为了证实百香果中TPS家族蛋白的分类,我们通过比对百香果和拟南芥43的TPS蛋白构建了系统进化树,其中21个属于TPS-a亚家族,16个属于TPS-b亚家族,3个属于TPS-f亚家族,这也可以帮助阐明不同亚家族中TPS基因成员的功能。表达水平分析表明,随着果实发育,PeTPS2/ 3/4/24的表达水平逐渐增加,与萜类代谢物含量的增加趋势一致(图5g)。此外,1个IDI,4个MTS,5个CCD,1个FPS,1个GGPS,1个GPS,2个HDR基因也被鉴定。虽然这些基因家族的成员数量很少,但它们的表达水平随着果实的发育而发生了很大的变化;例如,随着果实的发育,聚乙二醇单丁醚1、聚乙二醇单丁醚1和聚乙二醇单丁醚1/4的表达水平逐渐增加。这些基因,尤其是ACX基因、ADH基因、ALDH基因和HPL基因,可能在萜类化合物的代谢中起重要作用。
萜烯代谢物主要由萜烯代谢途径产生,我们在该途径中鉴定了八个重要的基因家族
(图5a)。大多数基因位于染色体4、6和8上。成员最多的家族是TPS基因家族,有41个成员。在萜烯合成中可能起关键作用的TPS的量与拟南芥、水稻和木薯中的相似(图5b)。在TPS-b亚家族中也发现了两个串联重复单元(图5c)。另一方面,我们发现许多胁迫相关和防御相关的顺式元件位于ADH基因家族的启动子区(图5e)。为了证实百香果中TPS家族蛋白的分类,我们通过比对百香果和拟南芥43的TPS蛋白构建了系统进化树,其中21个属于TPS-a亚家族,16个属于TPS-b亚家族,3个属于TPS-f亚家族,这也可以帮助阐明不同亚家族中TPS基因成员的功能。表达水平分析表明,随着果实发育,PeTPS2/ 3/4/24的表达水平逐渐增加,与萜类代谢物含量的增加趋势一致(图5g)。此外,1个IDI,4个MTS,5个CCD,1个FPS,1个GGPS,1个GPS,2个HDR基因也被鉴定。虽然这些基因家族的成员数量很少,但它们的表达水平随着果实的发育而发生了很大的变化;例如,随着果实的发育,聚乙二醇单丁醚1、聚乙二醇单丁醚1和聚乙二醇单丁醚1/4的表达水平逐渐增加。这些基因,尤其是ACX基因、ADH基因、ALDH基因和HPL基因,可能在萜类化合物的代谢中起重要作用。
图5. 百香果脂肪酸代谢和萜烯生物合成途径的表达热图和代谢物含量
本项研究利用
代谢组学
结合
基因组学
和
转录组学
等多组学的方法,对百香果基因组进行测序,及不同发育时期基因表达模式和代谢物积累模式的分析,从基因、转录和代谢等多层面研究了百香果风味品质的调控机制,这为百香果的遗传研究和改良带到了新的研究领域。