
1、第一個示例,我們要來進行簡單的爬蟲來爬別人的網頁

這是爬回來的網頁輸出:

這中間到底發生了什麼事呢?讓我們打開Fiddler來看看吧:

左邊標紅的就表示我們本次訪問成功,為http 200
右邊上方這是python生成 的請求報頭,不清楚看下面:

很簡單的一個報頭,然後再來看看響應回來的html

這裡響應回來的就是我們上面在python的idle中打印出來的網頁了!
2、偽裝成瀏覽器來爬網頁
有些網頁,比如登錄的。如果你不是從瀏覽器發起的起求,這就不會給你響應,這時我們就需要自己來寫報頭。然後再發給網頁的服務器,這時它就以為你就是一個正常的瀏覽器。從而就可以爬了!

3、爬取網站上的圖片


Python3.x 自動登錄
python3.4代碼編寫:

來看看結果:
這時運行返回的

原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/284425.html