本文目錄一覽:
- 1、python 不同時間拍攝的圖片如何對比差異
- 2、python3.6怎麼讀取照片的均值
- 3、怎樣用Python將百度雲盤裡的文件查重並刪除
- 4、Python如何圖像識別?
- 5、NLP之gensim庫python實現文本相似度/匹配/查重
- 6、python代碼查重原理
python 不同時間拍攝的圖片如何對比差異
比較不同
使用PIL(Pillow library)庫
安裝 pip install pillow,然後直接用其中的ImageChops函數
from PIL import Imagefrom PIL import ImageChops
def compare_images(path_one, path_two, diff_save_location):
“””
比較圖片,如果有不同則生成展示不同的圖片
@參數一: path_one: 第一張圖片的路徑
@參數二: path_two: 第二張圖片的路徑
@參數三: diff_save_location: 不同圖的保存路徑
“””
image_one = Image.open(path_one)
image_two = Image.open(path_two)
diff = ImageChops.difference(image_one, image_two)
if diff.getbbox() is None: # 圖片間沒有任何不同則直接退出
return
else:
diff.save(diff_save_location)
if __name__ == ‘__main__’:
compare_images(‘/path/to/瀑布.jpg’, ‘/path/to/瀑布改.jpg’, ‘/path/to/不同.jpg’)
結果,底部的不同被顯示出來了
python3.6怎麼讀取照片的均值
計算圖像均值是圖像預處理中的常見操作,你可以考慮利用RGB的信息來計算出來。
import os
import cv2
from numpy import *
img_dir=’d:\\’
img_list=os.listdir(img_dir)
img_size=224
sum_r=0
sum_g=0
sum_b=0
count=0
for img_name in img_list:
img_path=os.path.join(img_dir,img_name)
img=cv2.imread(img_path)
img=cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
img=cv2.resize(img,(img_size,img_size))
sum_r=sum_r+img[:,:,0].mean()
sum_g=sum_g+img[:,:,1].mean()
sum_b=sum_b+img[:,:,2].mean()
count=count+1
sum_r=sum_r/count
sum_g=sum_g/count
sum_b=sum_b/count
img_mean=[sum_r,sum_g,sum_b]
print img_mean1
怎樣用Python將百度雲盤裡的文件查重並刪除
我沒有見過百度有提供對外開放的網盤API,所以可能只有一個方法來解決,就是使用百度網盤客戶端把網盤中所有的數據同步到本地,然後寫個腳本在本地進行過濾、刪除等操作,正常情況下這些操作也會同步到線上。
Python如何圖像識別?
1. 簡介。
圖像處理是一門應用非常廣的技術,而擁有非常豐富第三方擴展庫的 Python 當然不會錯過這一門盛宴。PIL (Python Imaging Library)是 Python 中最常用的圖像處理庫,目前版本為 1.1.7,我們可以 在這裡 下載學習和查找資料。
Image 類是 PIL 庫中一個非常重要的類,通過這個類來創建實例可以有直接載入圖像文件,讀取處理過的圖像和通過抓取的方法得到的圖像這三種方法。
2. 使用。
導入 Image 模塊。然後通過 Image 類中的 open 方法即可載入一個圖像文件。如果載入文件失敗,則會引起一個 IOError ;若無返回錯誤,則 open 函數返回一個 Image 對象。現在,我們可以通過一些對象屬性來檢查文件內容,即:
1 import Image
2 im = Image.open(“j.jpg”)
3 print im.format, im.size, im.mode
4 JPEG (440, 330) RGB
這裡有三個屬性,我們逐一了解。
format : 識別圖像的源格式,如果該文件不是從文件中讀取的,則被置為 None 值。
size : 返回的一個元組,有兩個元素,其值為象素意義上的寬和高。
mode : RGB(true color image),此外還有,L(luminance),CMTK(pre-press image)。
現在,我們可以使用一些在 Image 類中定義的方法來操作已讀取的圖像實例。比如,顯示最新載入的圖像:
1 im.show()
2
輸出原圖:
3. 函數概貌。
3.1 Reading and Writing Images : open( infilename ) , save( outfilename )
3.2 Cutting and Pasting and Merging Images :
crop() : 從圖像中提取出某個矩形大小的圖像。它接收一個四元素的元組作為參數,各元素為(left, upper, right, lower),坐標系統的原點(0, 0)是左上角。
paste() :
merge() :
1 box = (100, 100, 200, 200)
2 region = im.crop(box)
3 region.show()
4 region = region.transpose(Image.ROTATE_180)
5 region.show()
6 im.paste(region, box)
7 im.show()
其效果圖為:
旋轉一幅圖片:
1 def roll(image, delta):
2 “Roll an image sideways”
3
4 xsize, ysize = image.size
5
6 delta = delta % xsize
7 if delta == 0: return image
8
9 part1 = image.crop((0, 0, delta, ysize))
10 part2 = image.crop((delta, 0, xsize, ysize))
11 image.paste(part2, (0, 0, xsize-delta, ysize))
12 image.paste(part1, (xsize-delta, 0, xsize, ysize))
13
14 return image
3.3 幾何變換。
3.3.1 簡單的幾何變換。
1 out = im.resize((128, 128)) #
2 out = im.rotate(45) #逆時針旋轉 45 度角。
3 out = im.transpose(Image.FLIP_LEFT_RIGHT) #左右對換。
4 out = im.transpose(Image.FLIP_TOP_BOTTOM) #上下對換。
5 out = im.transpose(Image.ROTATE_90) #旋轉 90 度角。
6 out = im.transpose(Image.ROTATE_180) #旋轉 180 度角。
7 out = im.transpose(Image.ROTATE_270) #旋轉 270 度角。
各個調整之後的圖像為:
圖片1:
圖片2:
圖片3:
圖片4:
3.3.2 色彩空間變換。
convert() : 該函數可以用來將圖像轉換為不同色彩模式。
3.3.3 圖像增強。
Filters : 在 ImageFilter 模塊中可以使用 filter 函數來使用模塊中一系列預定義的增強濾鏡。
1 import ImageFilter
2 imfilter = im.filter(ImageFilter.DETAIL)
3 imfilter.show()
3.4 序列圖像。
即我們常見到的動態圖,最常見的後綴為 .gif ,另外還有 FLI / FLC 。PIL 庫對這種動畫格式圖也提供了一些基本的支持。當我們打開這類圖像文件時,PIL 自動載入圖像的第一幀。我們可以使用 seek 和 tell 方法在各幀之間移動。
1 import Image
2 im.seek(1) # skip to the second frame
3
4 try:
5 while 1:
6 im.seek( im.tell() + 1)
7 # do something to im
8 except EOFError:
9 pass
3.5 更多關於圖像文件的讀取。
最基本的方式:im = Image.open(“filename”)
類文件讀取:fp = open(“filename”, “rb”); im = Image.open(fp)
字符串數據讀取:import StringIO; im = Image.open(StringIO.StringIO(buffer))
從歸檔文件讀取:import TarIO; fp = TarIo.TarIO(“Image.tar”, “Image/test/lena.ppm”); im = Image.open(fp)
基本的 PIL 目前就練習到這裡。其他函數的功能可點擊 這裡 進一步閱讀。
NLP之gensim庫python實現文本相似度/匹配/查重
給定一個或多個搜索詞,如“高血壓 患者”,從已有的若干篇文本中找出最相關的(n篇)文本。
文本檢索(text retrieve)的常用策略是:用一個ranking function根據搜索詞對所有文本進行排序,選取前n個,就像百度搜索一樣。
結巴分詞後的停用詞性 [標點符號、連詞、助詞、副詞、介詞、時語素、‘的’、數詞、方位詞、代詞]
對一篇文章分詞、去停用詞
對目錄下的所有文本進行預處理,構建字典
python代碼查重原理
a=[‘python’,1,2,3,1,6,’a’,’a’,3,3,3,’a’,’python’,’3′,’8′]
b=list(set(a))
cf=[]
for i in b:
cf.append(a.count(b))
for i in range(len(b)):
print(b[i],’一共有’,cf[i],’個’,sep=”)
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/184891.html