主要观点总结
数据堂联合中国移动、Samsung、Meta等企业在INTERSPEECH2025国际会议上推出多语种对话语音语言模型研讨会,旨在通过举办MLC-SLM挑战赛和发布真实多语种对话语音数据集来促进语音对话方向的研究。本次研讨会设立了两个赛道,包括多语种对话语音识别和多语种对话语音日志与识别。数据集包含多种语言,并设置了训练集、开发集、评估集等。竞赛奖金总额为20,000美金,并且提供了注册方式和官方群等信息。
关键观点总结
关键观点1: 活动目的
通过MLC-SLM挑战赛和真实多语种对话语音数据集的发布,促进语音对话方向的研究。
关键观点2: 活动赛道
设立了两个赛道,包括多语种对话语音识别和多语种对话语音日志与识别。
关键观点3: 数据集介绍
包含多种语言,如英语、法语、德语等,总时长约1500小时的多语种对话语音数据。
关键观点4: 竞赛日程
详细列出了竞赛的注册、数据发布、论文提交等关键时间节点。
关键观点5: 竞赛奖金
本次竞赛奖金总额为20,000美金,优秀团队奖金包括第一名5,000美金等。
正文
数据堂联合中国移动、Samsung、Meta等全球多家知名企业,在即将举行的INTERSPEECH2025国际会议上推出多语种对话语音语言模型研讨会,即MLC-SLM Workshop2025。
旨在通过举办多语种对话语音语言模型 (MLC-SLM) 挑战赛,以及发布真实的多语种对话语音数据集来促进该方向的研究。
目前,大语言模型(LLMs)在各种下游任务中均展现出卓越的性能,已成为语言理解和文本生成等任务的基础模型。近年来,研究者们开始关注如何将 LLMs 应用于语音和音频处理任务,如自动语音识别 (ASR)、音频字幕生成以及语音对话系统等新兴领域。
然而,构建强大的基于LLM的语音对话系统,在很大程度上依赖于真实世界的对话语音数据。这些数据涵盖了人类语音交流的多种复杂场景,
包括自然停顿、中断、说话者重叠和多样化的对话风格。
此类数据的稀缺性,尤其是在多语种环境中,极大地限制了该领域的研究和发展。
真实对话语音数据不仅对于技术进步至关重要,还在构建能够理解多语种和长上下文内容的人工智能系统方面发挥关键作用。对于下一代人机交互系统而言,语音对话是核心的沟通方式,高质量的对话语音数据对于提升其准确性和自然度尤为重要。
因此,
本次研讨会旨在通过举办多语种对话语音语言模型 (MLC-SLM) 挑战赛,以及发布真实的多语种对话语音数据集来促进该方向的研究。
目标为
开发基于LLM的多语种ASR模型
。参赛者将获得每段对话的真实时间戳标注及说话者标签用于切分语音片段。该任务的重点是优化多语种对话环境下的语音识别准确率。
目标为
开发一个同时进行说话者日志(即识别谁在何时说话),又能进行语音识别(将语音转换为文本)的系统。
评估过程中不提供任何先验信息,如真实时间戳标注、预先切分的语音片段、说话者标签等。该任务可以使用基于级联系统或端到端系统的方法。
训练集包含
11种语言:
英语、法语、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、俄语、泰语、越南语。每段录音均由两位说话者就随机分配的主题进行对话。对话自然流畅,使用 iPhone 等设备在安静的室内环境中录制。
英语数据集包含来自不同地区的约
500小时
录音,包括美国、英国、澳大利亚、印度和菲律宾英语。其他语言各贡献约
100小时
,
总共约1500小时的多语种对话语音数据。
开发集 (Dev) 与训练集设置相同,但每种语言包含约4小时的录音。任务I和任务II共享相同的开发集。
每个任务使用不同的评估集,即Eval_1和Eval_2。Eval_1包括真实时间戳标注和说话者标签,使用WER/CER进行评估。Eval_2不提供时间戳或说话者标签,因此需要使用说话者日志系统在识别之前对较长的录音进行分段。
参与者可以通过签署数据使用协议并提交至报名表单来访问数据集。提交后,数据下载链接将发送到您的电子邮件。
本次竞赛奖金总额为20,000美金。本次比赛优秀团队奖金(每项任务):
第一名:
5,000 美金
第二名:
3,000 美金
第三名:
2,000 美金
-
查看官网竞赛页面:
https://m.datatang.com/mcslm
(或点击下方阅读原文),下载并填写数据许可协议。
-
填写谷歌报名表单:
https://forms.gle/MyyJZ7kTwFtRorEg9
或腾讯报名表单:
https://docs.qq.com/form/page/DTHpBd2hrbGROUURk
通过审核即视为报名成功。
扫码加入官方竞赛群,获取最新信息!
-
冯俊兰
,IEEE Fellow及首席科学家,中国移动
-
Eng-Siong Chng
,教授,南洋理工大学
-
-
Khalid Choukri
,秘书长,欧洲语言资源协会
-
Shinji Watanabe
,副教授,卡内基梅隆大学
-
丰强泽
,联合创始人兼数据科学家,Datatang
-
-
-
-
-
期待各参赛团队积极筹备参赛作品,
创造佳绩!
END