PDFMathTranslate:AI驱动的开源工具,双语翻译PDF,保留排版

在日常学习和工作中,我们常常需要将各种文档翻译成不同语言。然而,对于包含复杂数学公式和特殊排版的 PDF 文档,传统翻译工具往往难以胜任。这对科研工作者、考研学生以及经常阅读外文资料的朋友来说尤为困扰。想要在翻译的同时完整保留原始排版和 LaTeX 数学公式,似乎是一项不可能的任务。别担心!今天为大家介绍一款强大的开源项目——PDFMathTranslate,它能轻松实现这一需求,成为你的理想助手!

PDFMathTranslate:AI驱动的开源工具,双语翻译PDF,保留排版

安装方式

在支持 Python 的环境中运行以下命令:

pip install pdf2zh

注意:要求 Python 版本 >= 3.8,<= 3.12。

基本用法

① 翻译整个 PDF

pdf2zh example.pdf

② 翻译部分页面

pdf2zh example.pdf -p 1-3,5

③ 指定翻译引擎

比如使用 moonshot-v1-8k(Kimi) 模型翻译:

pdf2zh example.pdf -s openai:moonshot-v1-8k

④ 不喜欢命令行的小伙伴,也可以尝试GUI模式:

pdf2zh -i

启动后,它会打开一个本地网页 http://127.0.0.1:7860/ ,在浏览器中完成各种操作即可。

核心功能亮点

  1. 排版与格式完整保留
    • 基于 AI 布局分析PDF 指令流解析,译文精确复现原始排版。
    • 优化 LaTeX 文献翻译,确保行内公式和行间公式保持原样,格式不变。
  2. 多翻译服务支持
    • 内置支持 Google 翻译DeepLAzureOpenAIOllama 等多种翻译服务。
    • 灵活选择免费或付费翻译引擎,兼容最新大语言模型,提升翻译质量。
  3. 全文检索与批量处理
    • 支持全文翻译或指定页面范围翻译(例如:-p 1-3,5),满足多场景需求。
    • 批量翻译功能高效实用,一次处理多份 PDF 文档,节省时间。
  4. 索引目录与图表样式保留
    • 保留索引目录结构,翻译后依旧方便快速查阅文档内容。
    • 图表样式与嵌入内容完美复现,确保信息完整无误。
  5. 图形界面模式
    • 提供本地网页 GUI,专为不熟悉命令行的用户设计,操作简单直观。
    • 使用命令 pdf2zh -i 启动图形界面,通过 http://127.0.0.1:7860/ 即可访问操作页面。

原创文章,作者:简单一点,如若转载,请注明出处:https://www.506064.com/n/181944.html

(2)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
简单一点的头像简单一点
上一篇 2024-11-23 07:13
下一篇 2024-11-24 06:16

发表回复

登录后才能评论