Python截圖完全指南

作為一名開發人員或愛好者，經常需要在工作或實驗中截圖並處理圖片。Python作為一門高級編程語言，自然也提供了豐富的截圖功能。本指南將會詳細介紹Python截圖及其相關應用。

一、Python截圖識別文字

在很多應用場景中，需要將截圖中的文字提取出來並進行處理。下面給出一個Python截圖並通過OCR技術識別文字的例子：

import pytesseract
from PIL import ImageGrab

# 截取屏幕
img = ImageGrab.grab()

# 識別文字
text = pytesseract.image_to_string(img)

print(text)

上述代碼使用了Python的Pillow庫中的ImageGrab模塊，用於截圖。另外，使用了OCR工具pytesseract進行文字識別。在使用該代碼時，需要先安裝並配置好pytesseract。

此外，還可以使用第三方庫pyocr來識別文字。其使用方法如下：

import pyocr
import pyocr.builders
from PIL import ImageGrab

# 截取屏幕
img = ImageGrab.grab()

# 初始化OCR工具
tools = pyocr.get_available_tools()
tool = tools[0]

# 識別文字
text = tool.image_to_string(
    img,
    lang='eng',
    builder=pyocr.builders.TextBuilder()
)

print(text)

二、Python截圖並識別

有時候需要在截圖的同時就進行文字識別，下面是一個例子，該例子使用了Python的Pillow庫和pytesseract：

import pytesseract
from PIL import Image

# 截取屏幕並識別文字
text = pytesseract.image_to_string(
    ImageGrab.grab(),
    lang='chi_sim',
)

print(text)

# 截圖並保存
ImageGrab.grab().save('screenshot.png')

使用Pillow庫可以很方便地讀取並操作圖片。語句ImageGrab.grab()用於截圖，然後使用pytesseract對截圖進行文字識別。

三、Python截圖代碼

Python的Pillow庫提供了非常方便的截圖功能。下面是一個例子，該例子截取了屏幕的一部分：

from PIL import ImageGrab

# 截取屏幕的一部分
img = ImageGrab.grab(bbox=(10, 10, 510, 510))

# 顯示圖片
img.show()

該例子使用了ImageGrab.grab()函數提供的bbox參數，用於指定截圖的區域。在該例子中，截圖的區域是屏幕左上角點坐標為(10, 10)，右下角點坐標為(510, 510)的矩形區域。

四、Python截圖快捷鍵

在實際使用Python截圖時，很多時候需要在使用快捷鍵時觸發截圖操作。下面給出一個實現Windows系統下快捷鍵截圖的例子：

import keyboard
from PIL import ImageGrab

# 處理截圖快捷鍵
def on_hotkey():
    img = ImageGrab.grab()
    img.save('screenshot.png')

# 註冊截圖快捷鍵
keyboard.add_hotkey('ctrl+alt+A', on_hotkey)

# 監聽Hotkey
keyboard.wait()

在上述代碼中，使用了第三方庫keyboard來實現快捷鍵觸發。該代碼只適用於Windows系統，如果使用的是MacOS或者Linux操作系統，需要更換相應的庫。

五、Python截圖工具

除了使用Python自帶的庫，還有很多第三方庫可以用於實現Python截圖功能。下面列舉一些比較常用和好用的Python截圖工具：

PyAutoGUI：自動化控制鼠標和鍵盤，包括截圖和圖像處理等功能。安裝方式為 pip install pyautogui。
ImageGrab：Python自帶庫，提供了截圖和屏幕錄製功能。
Pillow：優秀的Python第三方圖像處理庫，可以實現截圖、圖像讀取和寫入、圖像處理等功能。
opencv-python：強大的計算機視覺庫，提供了豐富的圖像處理和計算方法，支持截圖和圖像處理。

六、利用Python截圖

利用Python截圖功能，我們可以做很多有趣的事情。下面給出一些用Python截圖實現的常見應用：

自動化測試截圖：對於一些測試項目，需要對測試結果進行截圖。在Python中使用Pillow庫等工具可以實現自動化測試截圖。
屏幕錄製：可以使用Python截圖工具抓取屏幕圖像，並保存為視頻。
圖像處理：使用Pillow或opencv-python等庫，可以實現對截圖的各種處理，比如裁剪、翻轉、旋轉、顏色變換等。

七、Python截圖函數

Python截圖涉及的函數比較多，下面列舉一些常用的函數和對應的含義：

ImageGrab.grab(bbox=None)：用於截取屏幕圖像。bbox參數表示截取的區域。
Image.open(filename, mode=’r’)：打開一張圖片文件，可用於讀取、處理或修改圖片。mode參數表示打開方式。
Image.show(title=None, command=None)：在系統中顯示一張圖片。
Image.save(fp, format=None, **params)：保存一張圖像為文件。
pytesseract.image_to_string(image, lang=None, config=”, nice=0, output_type=Output.STRING)：使用OCR技術識別圖像中的文字。

八、Python截圖庫

除了Python自帶的庫外，還有很多非常優秀的Python第三方截圖庫。下面列舉一些常用和好用的Python截圖庫：

PyAutoGUI：自動化控制鼠標和鍵盤，包括截圖和圖像處理等功能。安裝方式為 pip install pyautogui。
ImageGrab：Python自帶庫，提供了截圖和屏幕錄製功能。
Pillow：優秀的Python第三方圖像處理庫，可以實現截圖、圖像讀取和寫入、圖像處理等功能。
opencv-python：強大的計算機視覺庫，提供了豐富的圖像處理和計算方法，支持截圖和圖像處理。

九、Python截圖4種方法

Python截圖有很多方法，下面介紹比較常用的4種方法：

ImageGrab.grab()：使用Python自帶的Pillow庫，截取整個屏幕。
ImageGrab.grab(bbox=None)：使用Python自帶的Pillow庫，截取指定區域的屏幕圖像。
pyautogui.screenshot()：使用第三方庫PyAutoGUI，截取整個屏幕。
pyautogui.screenshot(region=())：使用第三方庫PyAutoGUI，截取指定區域的屏幕圖像。

十、Python截圖整個網頁選取

有時候需要截取整個網頁內容，而不僅僅是可見部分。下面給出一個實現Python截取整個網頁的例子：

from selenium import webdriver

# 啟動瀏覽器
driver_path = 'chromedriver.exe' # chromedriver或geckodriver的路徑
browser = webdriver.Chrome(driver_path)
url = 'http://www.example.com'
browser.get(url)

# 執行JS腳本，並獲得網頁高度
js = 'return Math.max( document.body.scrollHeight, document.body.offsetHeight, document.documentElement.clientHeight, document.documentElement.scrollHeight, document.documentElement.offsetHeight );'
browser.execute_script(js)
height = browser.execute_script(js)

# 調整瀏覽器窗口大小並截圖
browser.set_window_size(1280, height)
browser.save_screenshot('screenshot.png')

# 關閉瀏覽器
browser.quit()

這段代碼使用了Selenium庫，啟動了Chrome瀏覽器，並打開了指定URL的網頁。然後，使用JavaScript腳本獲取了網頁的高度，並調整了瀏覽器窗口的大小，設置窗口高度和網頁高度相同。最後，使用瀏覽器的截圖功能進行截圖。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-hk/n/246234.html