在日常學習和工作中,我們常常需要將各種文檔翻譯成不同語言。然而,對於包含複雜數學公式和特殊排版的 PDF 文檔,傳統翻譯工具往往難以勝任。這對科研工作者、考研學生以及經常閱讀外文資料的朋友來說尤為困擾。想要在翻譯的同時完整保留原始排版和 LaTeX 數學公式,似乎是一項不可能的任務。別擔心!今天為大家介紹一款強大的開源項目——PDFMathTranslate,它能輕鬆實現這一需求,成為你的理想助手!

安裝方式
在支持 Python 的環境中運行以下命令:
pip install pdf2zh
注意:要求 Python 版本 >= 3.8,<= 3.12。
基本用法
① 翻譯整個 PDF
pdf2zh example.pdf
② 翻譯部分頁面
pdf2zh example.pdf -p 1-3,5
③ 指定翻譯引擎
比如使用 moonshot-v1-8k(Kimi) 模型翻譯:
pdf2zh example.pdf -s openai:moonshot-v1-8k
④ 不喜歡命令行的小夥伴,也可以嘗試GUI模式:
pdf2zh -i
啟動後,它會打開一個本地網頁 http://127.0.0.1:7860/ ,在瀏覽器中完成各種操作即可。
核心功能亮點
- 排版與格式完整保留
- 基於 AI 布局分析 和 PDF 指令流解析,譯文精確復現原始排版。
- 優化 LaTeX 文獻翻譯,確保行內公式和行間公式保持原樣,格式不變。
- 多翻譯服務支持
- 內置支持 Google 翻譯、DeepL、Azure、OpenAI 和 Ollama 等多種翻譯服務。
- 靈活選擇免費或付費翻譯引擎,兼容最新大語言模型,提升翻譯質量。
- 全文檢索與批量處理
- 支持全文翻譯或指定頁面範圍翻譯(例如:
-p 1-3,5
),滿足多場景需求。 - 批量翻譯功能高效實用,一次處理多份 PDF 文檔,節省時間。
- 支持全文翻譯或指定頁面範圍翻譯(例如:
- 索引目錄與圖表樣式保留
- 保留索引目錄結構,翻譯後依舊方便快速查閱文檔內容。
- 圖表樣式與嵌入內容完美復現,確保信息完整無誤。
- 圖形界面模式
- 提供本地網頁 GUI,專為不熟悉命令行的用戶設計,操作簡單直觀。
- 使用命令
pdf2zh -i
啟動圖形界面,通過 http://127.0.0.1:7860/ 即可訪問操作頁面。
原創文章,作者:簡單一點,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/181944.html