python爬取圖片的步驟,python簡單爬取圖片

本文目錄一覽：

1、linux下python怎麼寫爬蟲獲取圖片
2、Python如何爬取百度圖片？
3、python爬取圖片時候url地址是下載圖片時報錯了？
4、python如何利用requests和bs4爬取圖片？

linux下python怎麼寫爬蟲獲取圖片

跟linux有什麼關係，python是跨平台的，爬取圖片的代碼如下：

import urllib.requestimport osimport randomdef url_open(url):

req=urllib.request.Request(url) #為請求設置user-agent,使得程序看起來更像一個人類

req.add_header(‘User-Agent’,’Mozilla/5.0 (Windows NT 6.1; WOW64; rv:43.0) Gecko/20100101 Firefox/43.0′) #代理IP，使用戶能以不同IP訪問，從而防止被伺服器發現

”’iplist=[‘1.193.162.123:8000′,’1.193.162.91:8000′,’1.193.163.32:8000’]

proxy_support=urllib.request.ProxyHandler({‘http’:random.choice(iplist)})

opener=urllib.request.build_opener(proxy_support)

opener.addheaders=[(‘User-Agent’,’Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.154 Safari/537.36 LBBROWSER’)]

urllib.request.install_opener(opener)”’

response=urllib.request.urlopen(req)

html=response.read() return htmldef get_page(url):

html=url_open(url).decode(‘utf-8’)

a=html.find(‘current-comment-page’)+23

b=html.find(‘]’,a) #print(html[a:b])

return html[a:b]def find_imgs(url):

html=url_open(url).decode(‘utf-8’)

img_addrs=[]

a=html.find(‘img src=’) while a!=-1:

b=html.find(‘.jpg’,a,a+140) if b!=-1: if html[a+9]!=’h’:

img_addrs.append(‘http:’+html[a+9:b+4]) else:

img_addrs.append(html[a+9:b+4]) else:

b=a+9

a=html.find(‘img src=’,b) for each in img_addrs:

print(each+’我的列印’) return img_addrsdef save_imgs(folder,img_addrs):

for each in img_addrs: #print(‘one was saved’)

filename=each.split(‘/’)[-1] with open(filename,’wb’) as f:

img=url_open(each)

f.write(img)def download_mm(folder=’ooxx’,pages=10):

os.mkdir(folder)

os.chdir(folder)

url=””

page_num=int(get_page(url)) for i in range(pages):

page_num=page_num-1

page_url=url+’page-‘+str(page_num)+’#comments’

img_addrs=find_imgs(page_url)

save_imgs(folder,img_addrs)if __name__==’__main__’:

download_mm()1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374

完成

運行結果

Python如何爬取百度圖片？

幾乎所有的網站都會有反爬機制，這就需要在爬取網頁時攜帶一些特殊參數，比如：user-agent、Cookie等等，可以在寫代碼的時候用工具將所有參數都帶上。

python爬取圖片時候url地址是下載圖片時報錯了？

你的參數可能不對，你可以加個teace來看看，在報錯的第二十二行前，看一下參數是什麼，type看一下類型再說。

希望懂的回答能幫到你

是

python如何利用requests和bs4爬取圖片？

爬取網站的內容不管爬啥。肯定得找到需要爬取內容的位置。如果是圖片的話。首先得找到圖片的地址。把鏈接複製下來打開是你想要的圖片的話。直接請求那個地址。寫入文件就行。用二進位加後綴就能保存圖片了。圖片音樂和視頻都是一樣的。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/251992.html