专栏名称: BioArt
BioArt致力于分享生命科学领域科研学术背后鲜为人知的故事,及时报道和评论生命科学领域有料的动态,BioArt也是一个生命科学领域“百花齐放,百家争鸣”的舞台,循“自由之思想”与“独立之精神”为往圣继绝学。
目录
相关文章推荐
BioArt  ·  专家点评Nature | ... ·  16 小时前  
生信菜鸟团  ·  评估 ChIP-Seq 重复性 ·  2 天前  
BioArt  ·  Mol Cell | ... ·  2 天前  
BioArt  ·  Cell | ... ·  2 天前  
51好读  ›  专栏  ›  BioArt

Mol Cell | 揭秘细菌暗物质——隐藏的微蛋白质组

BioArt  · 公众号  · 生物  · 2025-03-18 00:01

正文

撰文 | 617

小开放阅读框 (small reading frames, smORF 通常指真核生物中少于100个密码子或原核生物中少于50、70或100个密码子的ORF。由于基因预测的局限性,当前关于smORF的研究十分有限,被视作基因组中的“暗物质”。

smORF编码的微蛋白可能具有多种功能。近年,一些研究团队通过核糖体印迹测序技术Ribo-Seq和蛋白质组学技术,在大肠杆菌、肠道沙门氏菌和金黄色葡萄球菌中发现并表征了数十种新微蛋白 【1-7】 。但是,目前对原核生物smORF的系统分析研究仍十分稀少,有许多微蛋白功能有待表征。

近日,美国国立卫生研究院 Eugene V. Koonin 团队在 Molecular Cell 志上发表了题为 The hidden bacterial microproteome 的文章。 该研究在来自肠杆菌科的5,668个基因组中鉴定出数百万个基因间smORF (ismORF) 并使用了多种计算方法对预测的细菌微蛋白组进行了表征,同时结合实验进行验证,揭示了ismORF的进化趋势和功能特征。


由于肠杆菌科的微生物有大量实验数据可用于验证计算预测结果的可靠性,因此作者选择了肠杆菌科。首先,作者从肠杆菌科23个不同属的5,668个基因组中确定了45,700,542个长度在15-70个密码子之间的ismORF。根据ismORF序列推测的微蛋白中位长度为27个氨基酸。与RefSeq中对应物种已注释的微蛋白相比,该研究预测的微蛋白长度更短且疏水性更强。

接着,作者利用RNAcode和EvolScore评估了ismORF的编码潜力。为了进一步提高结果的可靠性和准确性,作者还利用562,920种已被注释的肠道细菌功能性小蛋白进行训练,创建了一个能够有效预测编码潜力的随机森林模型。结合上述多种方法,最终 作者发现有4.3%微蛋白簇被预测为编码蛋白。 大多数微蛋白簇保守,并显示出负选择的特征。此外,约30% ismORF位于共线性区域,表明它们可能近期从非编码序列演化而来。

随后,作者重新分析了来自15个属的71个公开可用RNA-seq测序数据,以确认ismORF的转录情况。大约50%的ismORF的表达水平TPM值大于1。ismORF转录水平普遍低于已注释的小基因,表明 大多数微蛋白可能是由较年轻的基因编码的,受到某些特定条件的调控。 因此,作者重新分析了先前发表的11种应激条件下人类细菌病原体的转录组数据。结果显示,ismORFs差异表达最显著的应激条件是缺氧条件。

作者还探究了ismORF是否与上下游基因共转录, 结果显示大部分ismORF在正常情况下不会共转录。 但也有个别基因组中出现异常情况,有较多的ismORF与上下游基因共享一个主要转录起始位点。

接着,作者利用大肠杆菌和肠道沙门氏菌的Ribo-seq数据评估了ismORF的翻译情况, 发现部分ismORFs在转录后被翻译成微蛋白。 此外,作者还在大肠杆菌中对选定的16个ismORF进行了实验验证。结果显示,在37度LB培养条件下,可鉴定到其中11种ismORF表达的微蛋白。此外,作者还发现不同培养条件下 (高镁和低镁) 的ismORF表达情况存在显著差别,表明微蛋白可在特定条件下被诱导表达。

大多数功能性细菌微蛋白仅在少数物种中保守,并且由于长度短、疏水性和基因组注释差异等问题,导致直系同源微蛋白的鉴定十分困难。尽管如此,作者还是尝试探究了ismORF的进化保守性, 发现大部分微蛋白是谱系特异性的 。并且对不同属的微蛋白氨基酸序列进行对比分析发现,序列存在明显差异。此外,作者还发现许多微蛋白与转运蛋白基因、转录因子基因和假定基因共现,并且常位于编码基因的下游,可能通过通读事件 (read-through events) 产生。因此,蛋白质编码基因下游区域可能是产生新基因的热点区域。

作者还利用Alphafold2预测了假定的细菌微蛋白结构。由于微蛋白较小,因此与预期一致,大多数预测结果仅包含少量的二级结构。作者猜测微蛋白可能会通过同源寡聚化来稳定其结构并增加结构和功能的复杂性,因此进一步分析了微蛋白的聚合情况。结果发现,微蛋白可能通过多种方式形成同源寡聚化,相互作用的预测结果大多数形成二聚体,但也存在四聚体。上述结果提示了蛋白质折叠进化的一种机制,即通过基因重复和融合进化形成更复杂的结构。

大多数微蛋白可能通过蛋白质互作发挥作用。因此,最后,作者利用AlphaFold multimer预测了一小部分微蛋白的互作情况,并通过实验验证了YbhL与ORF.3078之间的互作, 证明了微蛋白会影响YbhL的稳定性。


综上, 该研究系统性分析了肠杆菌科中的ismORF,揭示了一个被隐藏的微蛋白质组。该研究提示我们细菌中可能存在大量未知且具有重要功能意义的微蛋白,为后续进一步在其他物种中发现新微蛋白提供了研究范式。

原文链接:https://doi.org/10.1016/j.molcel.2025.01.025

制版人:十一



参考文献


1. Weaver, J., Mohammad, F., Buskirk, A.R., and Storz, G. (2019). Identifying small proteins by ribosome profiling with stalled initiation complexes. mBio 10, e02819-18. https://doi.org/10.1128/mBio.02819-18.

2. Meydan, S., Marks, J., Klepacki, D., Sharma, V., Baranov, P.V., Firth, A.E., Margus, T., Kefi, A., Va ´ zquez-Laslop, N., and Mankin, A.S. (2019). Retapamulin-Assisted Ribosome Profiling Reveals the Alternative Bacterial Proteome. Mol. Cell 74, 481–493.e6. https://doi.org/10.1016/j.molcel.2019.02.017.

3. Stringer, A., Smith, C., Mangano, K., and Wade, J.T. (2021). Identification of novel translated small ORFs in Escherichia coli using complementary ribosome profiling approaches. J. Bacteriol. 204, JB0035221. https://doi.org/10.1128/JB.00352-21.

4. Fijalkowski, I., Peeters, M.K.R., and Van Damme, P. (2021). Small protein enrichment improves proteomics detection of sORF encoded polypeptides. Front. Genet. 12, 713400. https://doi.org/10.3389/fgene.2021.713400.

5. Fijalkowski, I., Willems, P., Jonckheere, V., Simoens, L., and Van Damme, P. (2022). Hidden in plain sight: challenges in proteomics detection of small ORF-encoded polypeptides. Microlife 3, uqac005. https://doi.org/10.1093/femsml/uqac005.

6. Venturini, E., Svensson, S.L., Maaß, S., Gelhausen, R., Eggenhofer, F., Li, L., Cain, A.K., Parkhill, J., Becher, D., Backofen, R., et al. (2020). A global data-driven census of Salmonella small proteins and their potential functions in bacterial virulence. Microlife 1, uqaa002. https://doi.org/10.1093/femsml/uqaa002.

7. Fuchs, S., Kucklick, M., Lehmann, E., Beckmann, A., Wilkens, M., Kolte, B., Mustafayeva, A., Ludwig, T., Diwo, M., Wissing, J., et al. (2021). Towards the characterization of the hidden world of small proteins in Staphylococcus aureus, a proteogenomics approach. PLoS Genet. 17, e1009585. https://doi.org/10.1371/journal.pgen.1009585.


学术合作组织

(*排名不分先后)


战略合作伙伴

(*排名不分先后)

(*排名不分先后)

·






请到「今天看啥」查看全文