python照片查重,python如何查重

本文目錄一覽：

1、python 不同時間拍攝的圖片如何對比差異
2、python3.6怎麼讀取照片的均值
3、怎樣用Python將百度雲盤裡的文件查重並刪除
4、Python如何圖像識別？
5、NLP之gensim庫python實現文本相似度/匹配/查重
6、python代碼查重原理

python 不同時間拍攝的圖片如何對比差異

比較不同

使用PIL（Pillow library）庫

安裝 pip install pillow，然後直接用其中的ImageChops函數

from PIL import Imagefrom PIL import ImageChops

def compare_images(path_one, path_two, diff_save_location):

“””

比較圖片，如果有不同則生成展示不同的圖片

@參數一: path_one: 第一張圖片的路徑

@參數二: path_two: 第二張圖片的路徑

@參數三: diff_save_location: 不同圖的保存路徑

“””

image_one = Image.open(path_one)

image_two = Image.open(path_two)

diff = ImageChops.difference(image_one, image_two)

if diff.getbbox() is None: # 圖片間沒有任何不同則直接退出

return

else:

diff.save(diff_save_location)

if __name__ == ‘__main__’:

compare_images(‘/path/to/瀑布.jpg’, ‘/path/to/瀑布改.jpg’, ‘/path/to/不同.jpg’)

結果，底部的不同被顯示出來了

python3.6怎麼讀取照片的均值

計算圖像均值是圖像預處理中的常見操作，你可以考慮利用RGB的信息來計算出來。

import os

import cv2

from numpy import *

img_dir=’d:\\’

img_list=os.listdir(img_dir)

img_size=224

sum_r=0

sum_g=0

sum_b=0

count=0

for img_name in img_list:

img_path=os.path.join(img_dir,img_name)

img=cv2.imread(img_path)

img=cv2.cvtColor(img,cv2.COLOR_BGR2RGB)

img=cv2.resize(img,(img_size,img_size))

sum_r=sum_r+img[:,:,0].mean()

sum_g=sum_g+img[:,:,1].mean()

sum_b=sum_b+img[:,:,2].mean()

count=count+1

sum_r=sum_r/count

sum_g=sum_g/count

sum_b=sum_b/count

img_mean=[sum_r,sum_g,sum_b]

print img_mean1

怎樣用Python將百度雲盤裡的文件查重並刪除

我沒有見過百度有提供對外開放的網盤API，所以可能只有一個方法來解決，就是使用百度網盤客戶端把網盤中所有的數據同步到本地，然後寫個腳本在本地進行過濾、刪除等操作，正常情況下這些操作也會同步到線上。

Python如何圖像識別？

1. 簡介。

圖像處理是一門應用非常廣的技術，而擁有非常豐富第三方擴展庫的 Python 當然不會錯過這一門盛宴。PIL （Python Imaging Library）是 Python 中最常用的圖像處理庫，目前版本為 1.1.7，我們可以在這裡下載學習和查找資料。

Image 類是 PIL 庫中一個非常重要的類，通過這個類來創建實例可以有直接載入圖像文件，讀取處理過的圖像和通過抓取的方法得到的圖像這三種方法。

2. 使用。

導入 Image 模塊。然後通過 Image 類中的 open 方法即可載入一個圖像文件。如果載入文件失敗，則會引起一個 IOError ；若無返回錯誤，則 open 函數返回一個 Image 對象。現在，我們可以通過一些對象屬性來檢查文件內容，即：

1 import Image

2 im = Image.open(“j.jpg”)

3 print im.format, im.size, im.mode

4 JPEG (440, 330) RGB

這裡有三個屬性，我們逐一了解。

format : 識別圖像的源格式，如果該文件不是從文件中讀取的，則被置為 None 值。

size : 返回的一個元組，有兩個元素，其值為象素意義上的寬和高。

mode : RGB（true color image），此外還有，L（luminance），CMTK（pre-press image）。

現在，我們可以使用一些在 Image 類中定義的方法來操作已讀取的圖像實例。比如，顯示最新載入的圖像：

1 im.show()

輸出原圖：

3. 函數概貌。

3.1 Reading and Writing Images : open( infilename ) , save( outfilename )

3.2 Cutting and Pasting and Merging Images :

crop() : 從圖像中提取出某個矩形大小的圖像。它接收一個四元素的元組作為參數，各元素為（left, upper, right, lower），坐標系統的原點（0, 0）是左上角。

paste() :

merge() :

1 box = (100, 100, 200, 200)

2 region = im.crop(box)

3 region.show()

4 region = region.transpose(Image.ROTATE_180)

5 region.show()

6 im.paste(region, box)

7 im.show()

其效果圖為：

旋轉一幅圖片：

1 def roll(image, delta):

2 “Roll an image sideways”

4 xsize, ysize = image.size

6 delta = delta % xsize

7 if delta == 0: return image

9 part1 = image.crop((0, 0, delta, ysize))

10 part2 = image.crop((delta, 0, xsize, ysize))

11 image.paste(part2, (0, 0, xsize-delta, ysize))

12 image.paste(part1, (xsize-delta, 0, xsize, ysize))

14 return image

3.3 幾何變換。

3.3.1 簡單的幾何變換。

1 out = im.resize((128, 128)) #

2 out = im.rotate(45) #逆時針旋轉 45 度角。

3 out = im.transpose(Image.FLIP_LEFT_RIGHT) #左右對換。

4 out = im.transpose(Image.FLIP_TOP_BOTTOM) #上下對換。

5 out = im.transpose(Image.ROTATE_90) #旋轉 90 度角。

6 out = im.transpose(Image.ROTATE_180) #旋轉 180 度角。

7 out = im.transpose(Image.ROTATE_270) #旋轉 270 度角。

各個調整之後的圖像為：

圖片1：

圖片2：

圖片3：

圖片4：

3.3.2 色彩空間變換。

convert() : 該函數可以用來將圖像轉換為不同色彩模式。

3.3.3 圖像增強。

Filters : 在 ImageFilter 模塊中可以使用 filter 函數來使用模塊中一系列預定義的增強濾鏡。

1 import ImageFilter

2 imfilter = im.filter(ImageFilter.DETAIL)

3 imfilter.show()

3.4 序列圖像。

即我們常見到的動態圖，最常見的後綴為 .gif ，另外還有 FLI / FLC 。PIL 庫對這種動畫格式圖也提供了一些基本的支持。當我們打開這類圖像文件時，PIL 自動載入圖像的第一幀。我們可以使用 seek 和 tell 方法在各幀之間移動。

1 import Image

2 im.seek(1) # skip to the second frame

4 try:

5 while 1:

6 im.seek( im.tell() + 1)

7 # do something to im

8 except EOFError:

9 pass

3.5 更多關於圖像文件的讀取。

最基本的方式：im = Image.open(“filename”)

類文件讀取：fp = open(“filename”, “rb”); im = Image.open(fp)

字符串數據讀取：import StringIO; im = Image.open(StringIO.StringIO(buffer))

從歸檔文件讀取：import TarIO; fp = TarIo.TarIO(“Image.tar”, “Image/test/lena.ppm”); im = Image.open(fp)

基本的 PIL 目前就練習到這裡。其他函數的功能可點擊這裡進一步閱讀。

NLP之gensim庫python實現文本相似度/匹配/查重

給定一個或多個搜索詞，如“高血壓患者”，從已有的若干篇文本中找出最相關的(n篇)文本。

文本檢索（text retrieve）的常用策略是：用一個ranking function根據搜索詞對所有文本進行排序，選取前n個，就像百度搜索一樣。

結巴分詞後的停用詞性 [標點符號、連詞、助詞、副詞、介詞、時語素、‘的’、數詞、方位詞、代詞]

對一篇文章分詞、去停用詞

對目錄下的所有文本進行預處理，構建字典

python代碼查重原理

a=[‘python’,1,2,3,1,6,’a’,’a’,3,3,3,’a’,’python’,’3′,’8′]

b=list(set(a))

cf=[]

for i in b:

cf.append(a.count(b))

for i in range(len(b)):

print(b[i],’一共有’,cf[i],’個’,sep=”)

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/184891.html