PDFMathTranslate:AI驅動的開源工具,雙語翻譯PDF,保留排版

在日常學習和工作中,我們常常需要將各種文檔翻譯成不同語言。然而,對於包含複雜數學公式和特殊排版的 PDF 文檔,傳統翻譯工具往往難以勝任。這對科研工作者、考研學生以及經常閱讀外文資料的朋友來說尤為困擾。想要在翻譯的同時完整保留原始排版和 LaTeX 數學公式,似乎是一項不可能的任務。別擔心!今天為大家介紹一款強大的開源項目——PDFMathTranslate,它能輕鬆實現這一需求,成為你的理想助手!

PDFMathTranslate:AI驅動的開源工具,雙語翻譯PDF,保留排版

安裝方式

在支持 Python 的環境中運行以下命令:

pip install pdf2zh

注意:要求 Python 版本 >= 3.8,<= 3.12。

基本用法

① 翻譯整個 PDF

pdf2zh example.pdf

② 翻譯部分頁面

pdf2zh example.pdf -p 1-3,5

③ 指定翻譯引擎

比如使用 moonshot-v1-8k(Kimi) 模型翻譯:

pdf2zh example.pdf -s openai:moonshot-v1-8k

④ 不喜歡命令行的小夥伴,也可以嘗試GUI模式:

pdf2zh -i

啟動後,它會打開一個本地網頁 http://127.0.0.1:7860/ ,在瀏覽器中完成各種操作即可。

核心功能亮點

  1. 排版與格式完整保留
    • 基於 AI 布局分析PDF 指令流解析,譯文精確復現原始排版。
    • 優化 LaTeX 文獻翻譯,確保行內公式和行間公式保持原樣,格式不變。
  2. 多翻譯服務支持
    • 內置支持 Google 翻譯DeepLAzureOpenAIOllama 等多種翻譯服務。
    • 靈活選擇免費或付費翻譯引擎,兼容最新大語言模型,提升翻譯質量。
  3. 全文檢索與批量處理
    • 支持全文翻譯或指定頁面範圍翻譯(例如:-p 1-3,5),滿足多場景需求。
    • 批量翻譯功能高效實用,一次處理多份 PDF 文檔,節省時間。
  4. 索引目錄與圖表樣式保留
    • 保留索引目錄結構,翻譯後依舊方便快速查閱文檔內容。
    • 圖表樣式與嵌入內容完美復現,確保信息完整無誤。
  5. 圖形界面模式
    • 提供本地網頁 GUI,專為不熟悉命令行的用戶設計,操作簡單直觀。
    • 使用命令 pdf2zh -i 啟動圖形界面,通過 http://127.0.0.1:7860/ 即可訪問操作頁面。

原創文章,作者:簡單一點,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/181944.html

(2)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
簡單一點的頭像簡單一點
上一篇 2024-11-23 07:13
下一篇 2024-11-24 06:16

發表回復

登錄後才能評論