Meta 研究人员研发出一个 AI 模型,能即时翻译多达 101 种语言的语音和文本,包括直接语音到语音翻译。名为 SEAMLESSM4T 的 AI 模型,填补了语言覆盖方面的空白,并且性能优于现有的系统,它支持语音到语音(识别 101 种语言并翻译为 36 种语言)、语音到文本(101 种语言译为 96 种)、文本到语音(96 种语言译为 36 种)、文本到文本(96 种语言)的翻译,以及自动语音识别(96 种语言)。研究团队说,本项研究工作或可为快速通用翻译铺平道路,其资源公开可用(用于非商业用途),以协助进一步研究包容性语音翻译技术。研究团队表示,在语音到语音的翻译中,SEAMLESSM4T 的文本翻译比现有系统准确率提升 23%。同时该模型可过滤背景噪音并适应说话者的差异。
https://www.nature.com/articles/s41586-024-08359-z
https://news.sciencenet.cn/htmlnews/2025/1/537626.shtm
NVIDIA GTC 2025 早鸟票折扣福利,免费加入NVIDIA初创加速计划即可享受
NVIDIA初创加速计划是NVIDIA为全球创业公司打造的加速平台,旨在为创新企业提供全方位的支持。在中国,已有超过千家创业公司加入,并获得融资机会、客户对接、路演展示、技术支持、市场推广,以及NVIDIA软硬件产品折扣等独家资源支持。现在免费申请加入,还有机会获得 GTC25 早鸟票折扣,点击链接或者扫描即可免费申请加入。
免费申请通道:https://jinshuju.net/f/SsRLbl?x_field_1=solidot
您的赞赏是对我们的鼓励,We’ll be more solid with your donations.