项目简介
一款电子书转有声读物的工具:ebook2audiobookXTTS,自动生成且支持多语言和声音定制
支持多种电子书格式
,epub、pdf、mobi等20种格式,输出时,会创建一个 .m4b 文件,其中包含元数据和章节信息
支持多语言
,英语、西班牙语、法语、德语、意大利语、葡萄牙语、波兰语、土耳其语、俄语、荷兰语、捷克语、阿拉伯语、中文、日语、匈牙利语和韩语
使用Calibre和Coqui XTTS将电子书转为文本格式,用Coqui XTTS文本到语音转换,支持声音克隆功能,自定义TTS。
特点
🛠️要求
-
Python 3.x
-
coqui-tts
Python 包
-
Calibre(用于电子书转换)
-
FFmpeg(用于创建有声读物)
-
可选:用于语音克隆的自定义语音文件
🔧 安装说明
-
从Python.org
安装 Python 3.x。
-
安装Calibre
:
-
Ubuntu
:
sudo apt-get install -y calibre
-
macOS
:
brew install calibre
-
Windows
(管理员 Powershell):
choco install calibre
安装 FFmpeg
:
-
Ubuntu
:
sudo apt-get install -y ffmpeg
-
macOS
:
brew install ffmpeg
-
Windows
(Admin Powershell):
choco install ffmpeg
可选:安装 Mecab
(对于非拉丁语言):
-
Ubuntu
:
sudo apt-get install -y mecab libmecab-dev mecab-ipadic-utf8
-
macOS
:
brew install mecab
,
brew install mecab-ipadic
-
Windows
(Admin Powershell):
choco install mecab
(注意:日语支持有限)
安装Python包
:
pip install tts==0.21.3 pydub nltk beautifulsoup4 ebooklib tqdm
对于非拉丁语言
:
python -m unidic download
pip install mecab mecab-python3 unidic
用法
🖥️ Gradio 页界面
1. 运行脚本
:
python custom_model_ebook2audiobookXTTS_gradio.py
2. 打开 Web 应用程序
:单击终端中提供的 URL 以访问 Web 应用程序并转换电子书。
📝 基本用法
定制 XTTS 模型
python custom_model_ebook2audiobookXTTS.py <ebook_file_path> <target_voice_file_path> <language> <custom_model_path> <custom_config_path> <custom_vocab_path>
-
:电子书文件的路径。
-
:语音克隆可选。
-
:可选指定语言。
-
:
model.pth
的路径。
-
:
config.json
的路径。
-
:
vocab.json
的路径。
🐳 使用 Docker
您还可以使用 Docker 运行电子书到有声读物转换器。此方法可确保不同环境之间的一致性并简化设置。
🚀 运行 Docker 容器