专栏名称: GitHubStore
分享有意思的开源项目
目录
相关文章推荐
什么值得买  ·  这个节电小玩意,骗了多少农村老人?? ·  2 天前  
上海市场监管  ·  明天开始!新一轮消费券就按攻略这么领→ ·  3 天前  
上海市场监管  ·  明天开始!新一轮消费券就按攻略这么领→ ·  3 天前  
华人生活网  ·  手速要快!巴塔、Burberry、CK、汤米 ... ·  3 天前  
华人生活网  ·  手速要快!巴塔、Burberry、CK、汤米 ... ·  3 天前  
51好读  ›  专栏  ›  GitHubStore

保留原排版的PDF文档翻译工具:PDFMathTranslate

GitHubStore  · 公众号  ·  · 2024-11-12 08:49

正文

项目简介

一款可以保留原排版的PDF文档翻译工具:PDFMathTranslate,可以完整保留原文档中的公式、图表,支持双语对比

1、支持PDF科技论文的全文翻译和双语对照

2、可以保持原有目录结构

3、支持多种翻译服务,Google、DeepL、Ollama、OpenAI等


安装

要求 Python 版本 >=3.8, <=3.12

pip install pdf2zh

使用

命令行中执行翻译指令,在工作目录下生成翻译文档 example-zh.pdf 和双语对照文档 example-dual.pdf ,默认使用 Google 作为翻译服务


翻译完整文档

pdf2zh example.pdf

翻译部分文档

pdf2zh example.pdf -p 1-3,5


使用指定语言翻译

参考 Google Languages Codes, DeepL Languages Codes

pdf2zh example.pdf -li en -lo ja


使用 DeepL/DeepLX 翻译

参考 DeepLX

设置环境变量构建接入点: {DEEPL_SERVER_URL}/{DEEPL_AUTH_KEY}/translate

  • DEEPL_SERVER_URL (可选), e.g., export DEEPL_SERVER_URL=https://api.deepl.com

  • DEEPL_AUTH_KEY , e.g., export DEEPL_AUTH_KEY=xxx

pdf2zh example.pdf -s deepl


使用 Ollama 翻译

参考 Ollama

设置环境变量构建接入点: {OLLAMA_HOST}/api/chat

  • OLLAMA_HOST (可选), e.g., export OLLAMA_HOST=https://localhost:11434

pdf2zh example.pdf -s ollama:gemma2



使用 OpenAI/SiliconCloud 翻译

参考 OpenAI

设置环境变量构建接入点: {OPENAI_BASE_URL}/chat/completions

  • OPENAI_BASE_URL (可选), e.g., export OPENAI_BASE_URL=https://api.openai.com/v1

  • OPENAI_API_KEY , e.g., export OPENAI_API_KEY=xxx

pdf2zh example.pdf -s openai:gpt-4o


使用正则表达式指定需要保留样式的字体和字符

pdf2zh example.pdf -f "(CM[^RT].*|MS.*|.*Ital)" -c "(\(|\||\)|\+|=|\d|[\u0080-\ufaff])"


预览







请到「今天看啥」查看全文