专栏名称: 募格学术
募格学术提供科研工作者关心的各类学术与生活相关资讯与信息,帮助科研工作者更好的发表英文学术文章,助力于中国学术之崛起。
目录
相关文章推荐
NaturePortfolio  ·  全球头脑风暴 | “自然指数-神经科学”增刊 ·  2 天前  
51好读  ›  专栏  ›  募格学术

全球规模最大!985,发顶刊!

募格学术  · 公众号  · 科研  · 2024-10-11 12:20

正文

源:中山大学

    

据中山大学官微消息,10月9日,中山大学医学院施莽教授团队与阿里云李兆融团队在《细胞》(Cell)杂志上发表论文。报告发现了180个超群、超过16万种全球RNA病毒,这是迄今为止规模最大的RNA病毒研究,大幅扩展了全球RNA病毒的多样性。该研究将人工智能技术应用于病毒鉴定,发现了传统方法未能发现的病毒“暗物质”,探索了病毒学研究的新路径。



人工智能突破传统方法瓶颈


最早,人们通过分离培养病毒,在显微镜下观察确认病毒的存在。随着生命组学的发展,科学家们能够利用测序技术,比较未知病毒和已知病毒核酸序列的相似性,识别和鉴定新病毒。然而,RNA病毒是一种高度分化、种类繁多且容易变异的病毒,尤其在面对缺乏同源性或同源性极低的“暗物质病毒”时,这种序列同源性比对的方法很容易失灵。


人工智能技术的引入使突破“已知”寻找“未知”成为可能。研究中,团队采用的核心算法LucaProt是一种能够深度学习的Transformer模型,在大量学习病毒和非病毒基因组序列后,可以自主形成一套关于病毒的判断标准,从而在大量的RNA测序数据集中挖掘出病毒序列。在测试中,LucaProt表现出极高的准确性和特异性,假阳性率为0.014%,假阴性率为1.72%。在与其他病毒挖掘工具的对比中,它也在处理较长序列的方面展现出优势。


刷新全球病毒圈认知


利用LucaProt,研究团队对来自全球生物环境样本的10487份RNA测序数据进行病毒挖掘,发现了超过51万条病毒基因组,代表超过16万个潜在病毒种及180个RNA病毒超群,使RNA病毒超群数量扩容约9倍。其中23个超群无法通过序列同源方法识别,被称为病毒圈的“暗物质”。


在这项研究中,团队报告了迄今最长的RNA病毒基因组,长度达到47250个核苷酸;发现了超出以往认知的基因组结构,展现出RNA病毒基因组进化的灵活性;识别到多种病毒功能蛋白,特别是与细菌相关的功能蛋白,进一步表明还有更多类型的RNA噬菌体亟待探索。


研究指出,新发现的病毒分布在地球的各类生态环境中。总体上,落叶层、湿地、淡水和废水环境的病毒多样性最高。然而,在南极底泥、深海热泉等极端环境中,RNA病毒的多样性和丰度并不低。


人工智能或助力破解更多科研难题


在论文中,研究团队开源了LucaProt模型,并通过在线网站分享给全球科学家。中国工程院院士徐建国表示,未来,人工智能方法有望成为微生物学领域的主要工具,并可应用于病毒对人类致病性的预测。


据介绍,这项研究与阿里云飞天实验室的AI4S-生物计算团队合作开展,中山大学团队负责病毒学方面的问题,而阿里云团队则专注于人工智能模型的开发和计算。施莽教授说,“希望继续通过跨领域、紧密的科研合作,充分利用云计算和人工智能的优势,解决生命科学领域的重要问题。”


商务合作、广告投放
请联系微信号:mogobd

募格编辑提供专业的英文论文修改、润色服务及科研学术论文翻译服务拥有超2000名各学科编辑,以英语为母语,具有丰富的文稿修改编辑经验,让您的论文语言更加准确、地道和优美。

↓详情咨询客服微信,并领取优惠↓

好文章需要您的点赞加在看~