专栏名称: GitHubStore
分享有意思的开源项目
目录
相关文章推荐
湘微教育  ·  今天起,可以查分了! ·  14 小时前  
湘微教育  ·  今天起,可以查分了! ·  14 小时前  
青岛早报  ·  今起,可查成绩!山东是12:00 ·  16 小时前  
天下泉城  ·  今起,成绩可查!山东具体时间公布 ·  17 小时前  
鸡西新闻网  ·  即将出分!转存这份2025考研复试全攻略 ·  昨天  
鸡西新闻网  ·  即将出分!转存这份2025考研复试全攻略 ·  昨天  
发现新西兰  ·  突发:新西兰国会“封杀”DeepSeek!微 ... ·  3 天前  
51好读  ›  专栏  ›  GitHubStore

漫画自动翻译神器 Comic Translate

GitHubStore  · 公众号  ·  · 2024-07-24 14:02

正文

项目简介

许多自动漫画翻译器存在。但很少有能正确支持其他语言的不同类型的漫画。本项目旨在利用 GPT-4 的能力来翻译来自世界各地的漫画。目前,它支持翻译为英文、韩文、日文、法文、简体中文、繁体中文、俄文、德文、荷兰文、西班牙文和意大利文,以及这些语言之间的互译。它可以翻译成土耳其语、波兰语、葡萄牙语和巴西葡萄牙语,但不能翻译这些语言的内容。


对于几十种语言来说,最好的机器翻译器不是 Google Translate、Papago 甚至 DeepL,而是 GPT-4,并且优势明显。这在语言对(如韩文英文,日文英文等)间尤为明显,其他翻译器仍然常常会变成胡言乱语。


漫画样例

GPT-4o 作为翻译器。注意:其中一些漫画也有官方英文翻译

大海的凄惨

弗莉伦:旅途的终点

虫世界传奇

沙之日

玩家 (OH Hyeon-Jun)

碳与硅


安装

Python

安装 Python (<=3.10)。在设置中选择 "Add python.exe to PATH"。

https://www.python.org/downloads/

目前,由于 PaddleOCR 的问题,该项目无法完全在 Python 3.11 或更高版本上运行。如果您无意使用默认选项(Paddle)进行中文翻译,可以通过将

paddleocr==2.7.0.3paddlepaddle==2.5.2

替换为

PyMuPDF==1.23.8

在 requirements.txt 文件中来使用 Python 3.11 或更高版本。

克隆仓库(或下载文件夹),导航到文件夹

git clone https://github.com/ogkalu2/comic-translatecd comic-translate

并安装依赖项

pip install -r requirements.txt

如果您有 NVIDIA GPU,建议运行

pip uninstall torch torchvisionpip install torch==2.1.0+cu121 -f https://download.pytorch.org/whl/torch_stable.htmlpip install torchvision==0.16.0+cu121 -f https://download.pytorch.org/whl/torch_stable.html

注意:+cu121 中的121代表 CUDA 版本 - 12.1。将121替换为您的 CUDA 版本。例如,运行 CUDA 11.8 时替换为118。


使用

在comic-translate目录下运行

python comic.py

这将启动 GUI


提示

  • 导入 > 图像以选择单个或多个图像。如果您有 CBR 文件,您需要安装 Winrar 或 7-Zip,然后将其安装文件夹(例如 Windows 的"C:\Program Files\WinRAR")添加到 PATH。如果已安装但未添加到 PATH,您可能会收到错误信息,

raise RarCannotExec("Cannot find working tool")


在这种情况下,您可以遵循以下网站的说明:Windows, Linux, Mac

  • 前往设置 > 文本渲染 > 调整文本块以调整用于渲染的块的尺寸。适用于文本渲染过大/过小的情况。这将适用于页面上的所有检测到的块

  • 确保所选字体支持目标语言的字符


API 密钥

以下选择将需要访问封闭资源,因此需要 API 密钥:

  • 用于翻译的 GPT-4o 或 3.5(付费,每页约 $0.01 美元用于 4o)

  • DeepL 翻译器(免费,每月 500,000 个字符)

  • 用于 OCR 的 GPT-4o(法文、俄文、德文、荷兰文、西班牙文、意大利文的默认选项)(付费,每页约 $0.02 美元)

  • Microsoft Azure Vision 用于 OCR(免费,每月 5000 张图片)

  • Google Cloud Vision 用于 OCR(免费,每月 1000 张图片)。您可以前往设置 > 设置凭证 来设置 API 密钥


获取 API 密钥

Open AI (GPT)

  • 前往 OpenAI 的平台网站 platform.openai.com 并使用(或创建)一个 OpenAI 账户进行登录。

  • 将鼠标悬停在页面右侧任务栏上,选择 "API 密钥"。

  • 点击 "创建新秘密密钥" 来生成新 API 密钥。复制并保存它。


Google Cloud Vision

  • 登录/创建一个 Google Cloud 账户。前往Cloud Resource Manager并点击 "创建项目"。设置您的项目名称。

  • 在此处选择您的项目,然后选择 "计费",再选择 "创建账户"。在弹出窗口中,"启用计费账户",并接受免费试用账户的优惠。您的 "账户类型" 应为个人账户。填写有效信用卡信息。

  • 为项目启用 Google Cloud Vision 在这里

  • 在 Google Cloud Credentials 页面,点击 "创建凭证" 然后 API 密钥。复制并保存它。


工作原理

对话气泡检测和文本分割

speech-bubble-detector,text-segmenter。两个 yolov8m 模型,分别在 8000 张和 3000 张漫画(包括漫画、网络漫画、欧美漫画)图像上训练。

OCR







请到「今天看啥」查看全文