一、tesseract安裝教程
tesseract是一個免費的OCR引擎,支持70多種語言的文本識別。通過安裝tesseract,您可以使用Python等編程語言中提供的接口來識別文本並進行相關的處理。下面是tesseract的安裝步驟:
1、下載安裝程序
wget https://github.com/tesseract-ocr/tesseract/releases/download/4.1.1/tesseract-4.1.1.tar.gz
tar -zxvf tesseract-4.1.1.tar.gz
cd tesseract-4.1.1
./configure
make
make install
2、安裝語言包
wget https://github.com/tesseract-ocr/tessdata_best/raw/master/eng.traineddata
cp eng.traineddata /usr/local/share/tessdata/
3、測試tesseract安裝是否成功
tesseract test.png result -l eng
cat result.txt
二、tesseract安裝錯誤 pip
如果使用pip安裝tesseract出現錯誤,可以嘗試以下操作:
1、先安裝leptonica:
brew install leptonica
2、再用pip安裝tesseract:
pip install tesseract-ocr
三、tesseract安裝包
如果需要在離線環境下安裝tesseract,可在安裝tesseract的機器上進行以下操作:
1、下載tesseract安裝包和語言包:
wget https://github.com/tesseract-ocr/tesseract/releases/download/4.1.1/tesseract-4.1.1.tar.gz
wget https://github.com/tesseract-ocr/tessdata_best/raw/master/eng.traineddata
2、將tesseract安裝包和語言包拷貝到目標機器上,並解壓安裝包:
tar -zxvf tesseract-4.1.1.tar.gz
3、在目標機器上安裝tesseract:
cd tesseract-4.1.1
./configure
make
make install
4、將語言包拷貝到安裝目錄下:
cp eng.traineddata /usr/local/share/tessdata/
四、tesseract安裝時報錯
在安裝tesseract過程中,可能會遇到一些錯誤,例如:
1、configure: error: Leptonica library not found
解決方法:
brew install leptonica
2、configure: error: autoreconf not found
解決方法:
brew install autoconf automake libtool
五、tesseract安裝版本
tesseract有多個版本可供選擇,例如4.1.1、4.0.0等。我們建議安裝最新版本的tesseract,保持與開發者社區的同步。
六、tesseract ocr安裝
tesseract ocr是tesseract的一個擴展,使得tesseract可用於識別圖像中的文本。安裝方法和安裝tesseract基本相同。
wget https://github.com/tesseract-ocr/tesseract/releases/download/4.1.1/tesseract-ocr-4.1.1.tar.gz
tar -zxvf tesseract-ocr-4.1.1.tar.gz
cd tesseract-ocr-4.1.1
./configure
make
make install
七、tesseract安裝包下載
除了從官網下載tesseract安裝包之外,您還可以從以下幾個網站進行下載:
1、https://sourceforge.net/projects/tesseract-ocr-alt/files/
2、https://github.com/tesseract-ocr/tesseract/releases
八、tesseract安裝與配置
安裝tesseract後,需要進行相應的配置才能正常使用。下面是一些常見的配置方法:
1、設置環境變量
echo "export TESSDATA_PREFIX=/usr/local/share/" >> ~/.bash_profile
source ~/.bash_profile
2、設置別名
echo "alias tesseract='tesseract --psm 6'" >> ~/.bash_profile
source ~/.bash_profile
九、tesseract安裝經常錯誤
如果您在安裝tesseract時經常遇到錯誤,可以嘗試從以下幾個方面入手:
1、查看日誌文件 /var/log/pkgs.log
2、清理緩存
brew cleanup
3、重新安裝依賴庫
brew uninstall --ignore-dependencies jpeg libpng libtiff leptonica
brew install jpeg libpng libtiff leptonica
十、tesseract安裝字庫選取
tesseract支持多個語言字庫,您可以根據自己的需求選擇相應的字庫下載,並進行安裝。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/185409.html