今天給大家分享一個開源的文檔管理系統Paperless-ngx
,旨在將物理文檔轉換為可搜索的在線檔案,以實現無紙化辦公和高效的文檔管理。

核心特點
1.文檔管理與組織
- • 多樣化格式支持:能處理 PDF、圖像文件(如 JPEG、PNG)、純文本文件、Office 文檔(Word、Excel、PowerPoint 及 LibreOffice 等效格式)等多種格式的文檔。
- • 靈活的分類方式:通過標籤、通信人、類型等對掃描文檔進行組織和索引,用戶可自由配置文件名和文件夾格式,還支持自定義字段與多種數據類型。
2.數據處理與存儲
- • 本地安全存儲:數據存儲在本地服務器,絕不傳輸或共享,保障數據安全。
- • OCR 技術應用:運用開源 Tesseract 引擎進行 OCR 操作,識別超 100 種語言,為文檔添加可搜索和選擇的文本,便於掃描圖像文檔的搜索。
- • PDF/A 格式保存:文檔以適合長期存儲的 PDF/A 格式保存,並保留原始文檔不變。
3.智能功能特性
- • 機器學習輔助:利用機器學習自動為文檔添加標籤、通信人和文檔類型。
- • 高效索引與搜索:構建高效索引,支持全文搜索,具備自動補全、按相關性排序、高亮顯示匹配部分、搜索相似文檔等功能。
4.用戶交互與界面
- • 美觀易用的 Web 應用:擁有現代、美觀且可定製的 Web 界面,包含可定製儀錶盤、多方式篩選、批量編輯、拖放上傳、可保存和顯示自定義視圖、支持共享公共鏈接(可選過期)等功能。
- • 適配多種模式:提供三種文檔列表瀏覽風格,支持 “精簡” 側邊欄專註文檔操作,還具備黑暗模式。
5.權限管理與協作
- • 強大的權限系統:內置穩健的多用戶權限系統,支持全局權限以及按文檔或對象的權限設置。
- • 協作與工作流:支持電子郵件處理,可從多個郵箱賬戶導入文檔並配置規則,同時擁有強大的工作流系統,優化多核系統,可並行處理多個文檔。
6.系統維護與支持
- • 集成健康檢查:集成健全性檢查器,確保文檔檔案狀態良好。
- • 社區支持與協作:通過 GitHub 討論和 Matrix 聊天室提供社區支持,用戶可提交功能請求、報告 Bug、參與貢獻(包括翻譯),還與多種掃描儀和掃描工具兼容,其 Office 文檔和電子郵件處理功能由 Apache Tika 提供(可選,需配置)。
項目地址
https://github.com/paperless-ngx/paperless-ngx
原創文章,作者:簡單一點,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/152473.html