本文目錄一覽:
- 1、Python 圖像識別 如何找出圖像的中心點
- 2、怎麼用python識別圖像中的污點
- 3、如何通過python尋找背景圖片的最小重複單元
- 4、python 區域找圖是什麼思路
- 5、Python如何圖像識別?
- 6、python 根據絕對路徑找圖片,並把找到的保存在一個文件夾中
Python 圖像識別 如何找出圖像的中心點
用的 opencv 先灰度模糊,再二值化,找到圖形輪廓最後確定中心點·~
怎麼用python識別圖像中的污點
第一步:查找圖片在原始圖片上的坐標點
第二步:將圖片匹配的坐標點,轉換為手機屏幕上實際的坐標點
第三步:優化,截取手機上部分區域圖片,進行相似度匹配,提高匹配精度
如何通過python尋找背景圖片的最小重複單元
這個問題跟image registration很相似 ,其實就是假設圖像A和圖像B之間存在一個平移(以及旋轉)關係 ,使得平移後A和B重合的部分差別最小。
具體到這個問題, 只需要將源圖像A和目標圖像B都設成輸入圖像, 然後計算圖像差的時候 。算平移後A和B重合的部分就可以了, 這樣可以算出來一個平移向量, 有了平移向量之後, 在輸入圖像上面任意一點開始 ,這個點和他自身加上平移向量得到的點所圍成的矩形一定是重複單元。
至於要最小重複單元, 只需要找到最短的平移向量就可以了, 不過需要去掉平凡解(零向量)。
以前看過image registration的東西有個快速的方法可以做到這一點。
先將源圖片和目標圖片降採樣幾次, 得到圖像金字塔 先對金字塔頂端圖片上尋找最佳匹配。 然後將最佳匹配對應的平移旋轉參數作為初始估計, 再在下一層級的圖像上再次估計 直到最後在原圖像上估計。
python 區域找圖是什麼思路
可以參考如下代碼:
import os
from time import sleep
from myopencv import Image
import X
import gdkutils
class XAuto:
_screensize = None
def __init__(self, tmp_img=’/tmp/tmp%d.png’ % os.getpid(),
default_threshold=0.7, default_rect=None):
self.d = X.Display()
self.tmp_img = tmp_img
self.default_threshold = default_threshold
self.default_rect = default_rect
def find_and_click(self, *args, back=False, **kwargs):
pos = self.find(*args, **kwargs)
if pos:
if back:
self.click_and_back(pos)
else:
self.click(pos)
return pos
def find_and_moveto(self, *args, **kwargs):
pos = self.find(*args, **kwargs)
if pos:
self.moveto(pos)
return pos
def click(self, pos=None, button=X.LEFT_BUTTON):
d = self.d
if pos is not None:
d.motion(pos)
d.button(button)
d.flush()
def wait(self, seconds):
sleep(seconds)
def click_and_back(self, pos, button=X.LEFT_BUTTON):
d = self.d
old_pos = d.getpos()
d.motion(pos)
d.button(button)
d.motion(old_pos)
d.flush()
def moveto(self, pos):
d = self.d
d.motion(pos)
d.flush()
def key(self, keyname):
d = self.d
d.key(keyname)
d.flush()
def find(self, img, threshold=None, rect=None, repeat=1, interval=0.2):
if isinstance(img, str):
img = Image(img)
if rect is None:
rect = self.default_rect or (0, 0) + self.screensize
if threshold is None:
threshold = self.default_threshold
tmp_img = self.tmp_img
for _ in range(repeat):
gdkutils.screenshot(tmp_img, rect)
sc = Image(tmp_img)
(x, y), similarity = sc.match(img)
if similarity threshold:
x += rect[0]
y += rect[1]
x += img.width // 2
y += img.height // 2
return x, y
sleep(interval)
return False
@property
def screensize(self):
return self._screensize or gdkutils.get_screen_size()
def __del__(self):
try:
os.unlink(self.tmp_img)
except OSError:
pass
def monitor_size(self, *args, **kwargs):
return gdkutils.get_monitor_size(*args, **kwargs)
Python如何圖像識別?
1. 簡介。
圖像處理是一門應用非常廣的技術,而擁有非常豐富第三方擴展庫的 Python 當然不會錯過這一門盛宴。PIL (Python Imaging Library)是 Python 中最常用的圖像處理庫,目前版本為 1.1.7,我們可以 在這裡 下載學習和查找資料。
Image 類是 PIL 庫中一個非常重要的類,通過這個類來創建實例可以有直接載入圖像文件,讀取處理過的圖像和通過抓取的方法得到的圖像這三種方法。
2. 使用。
導入 Image 模塊。然後通過 Image 類中的 open 方法即可載入一個圖像文件。如果載入文件失敗,則會引起一個 IOError ;若無返回錯誤,則 open 函數返回一個 Image 對象。現在,我們可以通過一些對象屬性來檢查文件內容,即:
1 import Image
2 im = Image.open(“j.jpg”)
3 print im.format, im.size, im.mode
4 JPEG (440, 330) RGB
這裡有三個屬性,我們逐一了解。
format : 識別圖像的源格式,如果該文件不是從文件中讀取的,則被置為 None 值。
size : 返回的一個元組,有兩個元素,其值為象素意義上的寬和高。
mode : RGB(true color image),此外還有,L(luminance),CMTK(pre-press image)。
現在,我們可以使用一些在 Image 類中定義的方法來操作已讀取的圖像實例。比如,顯示最新載入的圖像:
1 im.show()
2
輸出原圖:
3. 函數概貌。
3.1 Reading and Writing Images : open( infilename ) , save( outfilename )
3.2 Cutting and Pasting and Merging Images :
crop() : 從圖像中提取出某個矩形大小的圖像。它接收一個四元素的元組作為參數,各元素為(left, upper, right, lower),坐標系統的原點(0, 0)是左上角。
paste() :
merge() :
1 box = (100, 100, 200, 200)
2 region = im.crop(box)
3 region.show()
4 region = region.transpose(Image.ROTATE_180)
5 region.show()
6 im.paste(region, box)
7 im.show()
其效果圖為:
旋轉一幅圖片:
1 def roll(image, delta):
2 “Roll an image sideways”
3
4 xsize, ysize = image.size
5
6 delta = delta % xsize
7 if delta == 0: return image
8
9 part1 = image.crop((0, 0, delta, ysize))
10 part2 = image.crop((delta, 0, xsize, ysize))
11 image.paste(part2, (0, 0, xsize-delta, ysize))
12 image.paste(part1, (xsize-delta, 0, xsize, ysize))
13
14 return image
3.3 幾何變換。
3.3.1 簡單的幾何變換。
1 out = im.resize((128, 128)) #
2 out = im.rotate(45) #逆時針旋轉 45 度角。
3 out = im.transpose(Image.FLIP_LEFT_RIGHT) #左右對換。
4 out = im.transpose(Image.FLIP_TOP_BOTTOM) #上下對換。
5 out = im.transpose(Image.ROTATE_90) #旋轉 90 度角。
6 out = im.transpose(Image.ROTATE_180) #旋轉 180 度角。
7 out = im.transpose(Image.ROTATE_270) #旋轉 270 度角。
各個調整之後的圖像為:
圖片1:
圖片2:
圖片3:
圖片4:
3.3.2 色彩空間變換。
convert() : 該函數可以用來將圖像轉換為不同色彩模式。
3.3.3 圖像增強。
Filters : 在 ImageFilter 模塊中可以使用 filter 函數來使用模塊中一系列預定義的增強濾鏡。
1 import ImageFilter
2 imfilter = im.filter(ImageFilter.DETAIL)
3 imfilter.show()
3.4 序列圖像。
即我們常見到的動態圖,最常見的後綴為 .gif ,另外還有 FLI / FLC 。PIL 庫對這種動畫格式圖也提供了一些基本的支持。當我們打開這類圖像文件時,PIL 自動載入圖像的第一幀。我們可以使用 seek 和 tell 方法在各幀之間移動。
1 import Image
2 im.seek(1) # skip to the second frame
3
4 try:
5 while 1:
6 im.seek( im.tell() + 1)
7 # do something to im
8 except EOFError:
9 pass
3.5 更多關於圖像文件的讀取。
最基本的方式:im = Image.open(“filename”)
類文件讀取:fp = open(“filename”, “rb”); im = Image.open(fp)
字符串數據讀取:import StringIO; im = Image.open(StringIO.StringIO(buffer))
從歸檔文件讀取:import TarIO; fp = TarIo.TarIO(“Image.tar”, “Image/test/lena.ppm”); im = Image.open(fp)
基本的 PIL 目前就練習到這裡。其他函數的功能可點擊 這裡 進一步閱讀。
python 根據絕對路徑找圖片,並把找到的保存在一個文件夾中
from PIL import Imageimport os.pathimport globdef convertjpg(jpgfile,outdir,width=1280,height=720): img=Image.open(jpgfile) new_img=img.resize((width,height),Image.BILINEAR) new_img.save(os.path.join(outdir,os.path.basename(jpgfile)))for jpgfile in glob.glob(“D:/python/*.jpg”): convertjpg(jpgfile,”D:/newfile”)
convertjpg調用時可以有四個參數,如convertjpg(jpgfile,”D:/newfile”,800,600)
Image open了jpg用完後要不要close?
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/156823.html