阿里巴巴通义实验室开发的新一代语音合成系统CosyVoice 2,可以将文字转换成自然、流畅的语音,速度快,音质好。
它是支持流式输入输出的,延迟只有 150 毫秒,比如可以配合 LLM 一边生成文本一边输入音频,从官网上的演示来看,模仿的效果很好,参考的声音是中文的话输出英文,音色保持的不错,也比较自然。
官网:网页链接
它是支持流式输入输出的,延迟只有 150 毫秒,比如可以配合 LLM 一边生成文本一边输入音频,从官网上的演示来看,模仿的效果很好,参考的声音是中文的话输出英文,音色保持的不错,也比较自然。
官网:网页链接