项目简介
许多自动漫画翻译器存在。但很少有能正确支持其他语言的不同类型的漫画。本项目旨在利用 GPT-4 的能力来翻译来自世界各地的漫画。目前,它支持翻译为英文、韩文、日文、法文、简体中文、繁体中文、俄文、德文、荷兰文、西班牙文和意大利文,以及这些语言之间的互译。它可以翻译成土耳其语、波兰语、葡萄牙语和巴西葡萄牙语,但不能翻译这些语言的内容。
对于几十种语言来说,最好的机器翻译器不是 Google Translate、Papago 甚至 DeepL,而是 GPT-4,并且优势明显。这在语言对(如韩文英文,日文英文等)间尤为明显,其他翻译器仍然常常会变成胡言乱语。
漫画样例
GPT-4o 作为翻译器。注意:其中一些漫画也有官方英文翻译
大海的凄惨
弗莉伦:旅途的终点
虫世界传奇
沙之日
玩家 (OH Hyeon-Jun)
碳与硅
安装
Python
安装 Python (<=3.10)。在设置中选择 "Add python.exe to PATH"。
https://www.python.org/downloads/
目前,由于 PaddleOCR 的问题,该项目无法完全在 Python 3.11 或更高版本上运行。如果您无意使用默认选项(Paddle)进行中文翻译,可以通过将
paddleocr==2.7.0.3
paddlepaddle==2.5.2
替换为
在 requirements.txt 文件中来使用 Python 3.11 或更高版本。
克隆仓库(或下载文件夹),导航到文件夹
git clone https://github.com/ogkalu2/comic-translate
cd comic-translate
并安装依赖项
pip install -r requirements.txt
如果您有 NVIDIA GPU,建议运行
pip uninstall torch torchvision
pip install torch==2.1.0+cu121 -f https://download.pytorch.org/whl/torch_stable.html
pip install torchvision==0.16.0+cu121 -f https://download.pytorch.org/whl/torch_stable.html
注意:+cu121 中的121代表 CUDA 版本 - 12.1。将121替换为您的 CUDA 版本。例如,运行 CUDA 11.8 时替换为118。
使用
在comic-translate目录下运行
这将启动 GUI
提示
raise RarCannotExec("Cannot find working tool")
在这种情况下,您可以遵循以下网站的说明:Windows, Linux, Mac
API 密钥
以下选择将需要访问封闭资源,因此需要 API 密钥:
-
用于翻译的 GPT-4o 或 3.5(付费,每页约 $0.01 美元用于 4o)
-
DeepL 翻译器(免费,每月 500,000 个字符)
-
用于 OCR 的 GPT-4o(法文、俄文、德文、荷兰文、西班牙文、意大利文的默认选项)(付费,每页约 $0.02 美元)
-
Microsoft Azure Vision 用于 OCR(免费,每月 5000 张图片)
-
Google Cloud Vision 用于 OCR(免费,每月 1000 张图片)。您可以前往设置 > 设置凭证 来设置 API 密钥
获取 API 密钥
Open AI (GPT)
-
前往 OpenAI 的平台网站 platform.openai.com 并使用(或创建)一个 OpenAI 账户进行登录。
-
将鼠标悬停在页面右侧任务栏上,选择 "API 密钥"。
-
点击 "创建新秘密密钥" 来生成新 API 密钥。复制并保存它。
Google Cloud Vision
-
登录/创建一个 Google Cloud 账户。前往Cloud Resource Manager并点击 "创建项目"。设置您的项目名称。
-
在此处选择您的项目,然后选择 "计费",再选择 "创建账户"。在弹出窗口中,"启用计费账户",并接受免费试用账户的优惠。您的 "账户类型" 应为个人账户。填写有效信用卡信息。
-
为项目启用 Google Cloud Vision 在这里
-
在 Google Cloud Credentials 页面,点击 "创建凭证" 然后 API 密钥。复制并保存它。
工作原理
对话气泡检测和文本分割
speech-bubble-detector,text-segmenter。两个 yolov8m 模型,分别在 8000 张和 3000 张漫画(包括漫画、网络漫画、欧美漫画)图像上训练。
OCR