在日常学习和工作中,我们常常需要将各种文档翻译成不同语言。然而,对于包含复杂数学公式和特殊排版的 PDF 文档,传统翻译工具往往难以胜任。这对科研工作者、考研学生以及经常阅读外文资料的朋友来说尤为困扰。想要在翻译的同时完整保留原始排版和 LaTeX 数学公式,似乎是一项不可能的任务。别担心!今天为大家介绍一款强大的开源项目——PDFMathTranslate,它能轻松实现这一需求,成为你的理想助手!

安装方式
在支持 Python 的环境中运行以下命令:
pip install pdf2zh
注意:要求 Python 版本 >= 3.8,<= 3.12。
基本用法
① 翻译整个 PDF
pdf2zh example.pdf
② 翻译部分页面
pdf2zh example.pdf -p 1-3,5
③ 指定翻译引擎
比如使用 moonshot-v1-8k(Kimi) 模型翻译:
pdf2zh example.pdf -s openai:moonshot-v1-8k
④ 不喜欢命令行的小伙伴,也可以尝试GUI模式:
pdf2zh -i
启动后,它会打开一个本地网页 http://127.0.0.1:7860/ ,在浏览器中完成各种操作即可。
核心功能亮点
- 排版与格式完整保留
- 基于 AI 布局分析 和 PDF 指令流解析,译文精确复现原始排版。
- 优化 LaTeX 文献翻译,确保行内公式和行间公式保持原样,格式不变。
- 多翻译服务支持
- 内置支持 Google 翻译、DeepL、Azure、OpenAI 和 Ollama 等多种翻译服务。
- 灵活选择免费或付费翻译引擎,兼容最新大语言模型,提升翻译质量。
- 全文检索与批量处理
- 支持全文翻译或指定页面范围翻译(例如:
-p 1-3,5
),满足多场景需求。 - 批量翻译功能高效实用,一次处理多份 PDF 文档,节省时间。
- 支持全文翻译或指定页面范围翻译(例如:
- 索引目录与图表样式保留
- 保留索引目录结构,翻译后依旧方便快速查阅文档内容。
- 图表样式与嵌入内容完美复现,确保信息完整无误。
- 图形界面模式
- 提供本地网页 GUI,专为不熟悉命令行的用户设计,操作简单直观。
- 使用命令
pdf2zh -i
启动图形界面,通过 http://127.0.0.1:7860/ 即可访问操作页面。
原创文章,作者:简单一点,如若转载,请注明出处:https://www.506064.com/n/181944.html