该团队构建了膜荚黄芪的染色体水平基因组。膜荚黄芪基因组有9条染色体,组装大小为1.44 Gb,contig N50 2.82 Mb,BUSCO完整度为92.44%。除此之外,2023年中国农业大学董学会教授和孙连军教授(Plant Communications,2022,4,100469)通过测定蒙古黄芪(膜荚黄芪的变种)基因组推测蒙古黄芪7号染色体上可能存在黄芪三萜合成的基因簇(BGC),包括一个环阿屯醇合成酶,一个细胞色素氧化酶(cytochromeP450,CYP450)和一个尿苷二磷酸糖基转移酶(uridine diphosphate glycos-yltransferase,UGT)。同样,黄胜雄团队通过分析膜荚黄芪基因组,发现环阿屯醇合成酶(AmOSC3)附近也存在一个CYP450和一个UGT,但是通过异源体内体外功能验证,发现基因组上AmOSC3附近的CYP450和UGT不参与AG IV的生物合成。因此初步认为负责AG IV生物合成的基因在膜荚黄芪中不以簇的形式呈现。进一步对膜荚黄芪不同组织的转录组数据结合系统发育树分析,挖掘到催化环阿屯醇C-16羟化的氧化酶(AmCYP88D25)和C-3-OH糖基化的糖基转移酶(AmGT11和AmGT72)(图2)。并通过基因的组织特异性表达和酶动力学初步推测AmGT11更有可能参与AG IV的生物合成。
图2. AmCYP88D25、AmGT11、AmGT72和AmGT36的功能验证通过分析膜荚黄芪的基因组,该团队发现AmCYP88D25和AmGT11都位于1号染色体上,且这个区域(约4Mb)的范围内包含另外2个CYP450s(AmCYP88D7和AmCYP71D756)和两个糖基转移酶(AmGT36和AmGT37)(图3)。这个潜在的BGC在蒙古黄芪中也存在,更加印证这些基因可能参与黄芪属植物AG IV的生物合成。通过体外酶促反应证实AmGT36负责C-6-OH的葡萄糖糖基化(图2)。异源体内证实导入AmCYP88D25和AmCYP88D7的酵母菌株生产化合物6,16-dihydroxycycloartenol,从而说明AmCYP88D7负责AG IV生物合成过程中的C-16羟化(图3和图4)。同样,导入AmCYP88D25和AmCYP71D756的酵母菌株经验证生产16,24,25-trihydroxycycloartenol,由于酵母中存在环氧水解酶,因此猜测AmCYP71D756可能是催化16-hydroxycycloartenol的C-24,25环氧化(图3和图4)。通过AmCYP71D756的酵母微粒体体外实验证实这一猜想。但是同时导入AmCYP88D25、AmCYP88D7和AmCYP71D756的酵母菌株的发酵产物中虽然化合物16,16-dihydroxycycloartenol和16,24,25-trihydroxylation的峰面积降低,但是没有新的化合物出现,猜测可能是酵母内源的酶可能催化相应的产物,从而没有检测到新的化合物峰。因此,该团队进一步在烟草中验证这3个基因的功能,经过检测发现导入这3个CYP450s后,烟草中产生了化合物cyclocantogenin,—24,25-epoxy-6,16-dihydroxycycloartenol的水解产物。为了进一步证实AmCYP88D7和AmCYP71D756的活性,该团队通过体外酵母微粒体实验,分别以24,25-epoxy-16-hydroxycycloartenol和6,16-dihydroxycycloartenol为底物,经过检测证实AmCYP88D7和AmCYP71D756都能催化24,25-epoxy-6,16-dihydroxycycloartenol的产生。这些结果表明,AmCYP88D7和AmCYP71D756发挥协同作用,将化合物16-hydroxycycloartenol氧化为24,25-epoxy-6,16-dihydroxycycloartenol(图3和图4)。
图3. 位于膜荚黄芪1号染色体的基因簇以及AmCYP88D7、AmCYP71D756以及AmOGD1的功能验证;a. 1号染色体上负责AG IV生物合成的基因簇;b. 酵母体内验证AmCYP88D7和AmCYP71D756功能;c. 烟草瞬时表达验证AmCYP88D25、AmCYP88D7和AmCYP71D756功能;d. 体外验证AmOGD1功能;e. AmOGD1可能的催化机制。虽然通过体内体外功能验证了这个BGC上5个基因的功能,但是仍未完整解析AG IV的生物合成通路。该团队继续分析这个BGC中的其他类型的基因,发现该BGC中存在另外一类氧化酶—α-酮戊二酸依赖的双加氧酶(OGD)。对AmOGD1体外功能验证,证实其负责催化AG IV生物合成过程中20,24-四氢呋喃(THF)环的形成(图3和图4)。随后,该团队选择了原人参三醇作为模型,推测AmOGD1可能催化24,25-epoxy-6,16-dihydroxycycloartenol的C-20的羟化,从而形成黄芪皂苷中的20,24-THF环。除此之外,该研究团队通过RNA干扰(RNA interference,RNAi)技术进一步在黄芪毛状根中证实了这6个基因参与膜荚黄芪中AG IV的生物合成。该团队还在烟草中进一步验证AmGT11和AmGT36的催化先后顺序,但是根据实验结果证实AmGT11和AmGT36存在底物宽泛性(图4),没有严格的底物特异性。该团队在挖掘到完整负责AG IV生物合成的基因后(图4),将其通路重构在烟草中。正如预期的那样,在烟草中表达AmOSC3、AtCPR1以及本研究中鉴定的6个修饰酶,最终该团队在烟草叶片中检测到了AG IV的产生(产量为0.293 mg/g;干重),并通过过表达上游三萜前体合成通路基因NbtHMGR成功地将烟草叶片中AG IV的产量提高至2.224 mg/g(干重。)
图4. 在烟草中进行瞬时表达重构AG IV的生物合成黄胜雄课题组通过对膜荚黄芪基因组和转录组进行分析,挖掘出膜荚黄芪中AG IV生物合成的BGC(图3和图4),并通过在烟草叶片中瞬时表达,实现了AG IV的异源合成。该研究发现的黄芪三萜生物合成基因簇是目前自然界报道的最大天然产物基因簇。与之前报道的三萜类基因簇不同,这一基因簇缺少骨架合成酶,为其他萜类天然药物的生物合成解析提供了重要参考。除此之外,基因簇中AmOGD1参与AG IV的生物合成说明了植物似乎不仅利用CYP450,还利用2-OGD家族的成员修饰三萜骨架。同时,这些基因的挖掘和全合成途径的解析为后续的中药新品种选育及黄芪三萜创新药物研发奠定了坚实的药源基础。
黄胜雄课题组的徐冰艳博士研究生、黄建萍研究员、彭国情和曹文颖硕士研究生为本论文的共同第一作者,黄胜雄研究员为通讯作者,成都中医药大学陈士林院士和鲁南制药基团合作者为本研究提供了大力支持。上述工作得到了国家合成生物学重点研发计划、国家自然科学基金、云南省“兴滇英才支持计划”等项目资助。