转发微博
Kokoro 82M 这个 TTS 模型也太好了#AI创造营##ai#
模型大小只有不到 300M,生成的音频质量很高
在 T4 上,只需要 4.5 秒就能生成 2 分 25 秒的语音
可惜的是只支持英文,不过可以按他们的架构训练其他语言,只需要不到 100 小时的音频数据
模型下载:huggingface.co/hexgrad/Kokoro-82M
模型演示:huggingface.co/spaces/hexgrad/Kokoro-TTS 歸藏的AI工具箱的微博视频
模型大小只有不到 300M,生成的音频质量很高
在 T4 上,只需要 4.5 秒就能生成 2 分 25 秒的语音
可惜的是只支持英文,不过可以按他们的架构训练其他语言,只需要不到 100 小时的音频数据
模型下载:huggingface.co/hexgrad/Kokoro-82M
模型演示:huggingface.co/spaces/hexgrad/Kokoro-TTS 歸藏的AI工具箱的微博视频