专栏名称: 歸藏的AI工具箱
互联网科技博主 产品设计师、模型设计师、 不会代码的独立开发者。 关注人工智能、LLM 、 Stable Diffusion 和设计。
目录
相关文章推荐
新浪科技  ·  【#DeepSeek下周开源5个代码库#,每 ... ·  3 天前  
腾讯研究院  ·  腾讯研究院AI速递 20250221 ·  3 天前  
51好读  ›  专栏  ›  歸藏的AI工具箱

Kokoro 82M 这个 TTS 模型也太好了#AI创造营##-20250114010623

歸藏的AI工具箱  · 微博  ·  · 2025-01-14 01:06

正文

2025-01-14 01:06

Kokoro 82M 这个 TTS 模型也太好了 #AI创造营# #ai#

模型大小只有不到 300M,生成的音频质量很高

在 T4 上,只需要 4.5 秒就能生成 2 分 25 秒的语音

可惜的是只支持英文,不过可以按他们的架构训练其他语言,只需要不到 100 小时的音频数据

模型下载:huggingface.co/hexgrad/Kokoro-82M
模型演示:huggingface.co/spaces/hexgrad/Kokoro-TTS






请到「今天看啥」查看全文