本文目錄一覽:
- 1、php curl登陸和獲取內容類,請各位高手看怎麼使用
- 2、用php的Snoopy如何抓取網頁的驗證碼呢?
- 3、php偽造ip獲取網頁內容,求高手
- 4、php採集程序問題
- 5、大家談談 面對驗證碼如何模擬登錄? – PHP進階討論
php curl登陸和獲取內容類,請各位高手看怎麼使用
由於每個網站的信息不一樣,沒有通用的curl的。等看你的具體需求,若你要模擬登錄可以看下snoopy,一個基於curl的類,抓取信息可以用querylist
用php的Snoopy如何抓取網頁的驗證碼呢?
curl就可以了
?php
header(‘Content-Type:image/png’);
$url = “圖片鏈接”;//圖片鏈接
$ch = curl_init();
//Cookie:PHPSESSID=121b1127dcded8702c6a1e702c40eca4
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch,CURLOPT_COOKIE,’這裡是你的cookies’);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 0);
curl_setopt($ch, CURLOPT_TIMEOUT,0);//忽略超時
curl_setopt($ch, CURLOPT_NOBODY, false);
$str = curl_exec($ch);
curl_close($ch);
php偽造ip獲取網頁內容,求高手
偽造IP是不可能的,HTTP協議是機遇TCP,你發送GET命令過去必須留有準確的IP地址,否則對方無法把結果發給你,你與服務器xxx.xxx.xx的通訊相當於寫信,你匿名寫信只能攻擊,要獲取返回的東西必須提交真實的地址。
無論使用CURL還是別的方法,都要受前面的基本規則限制。
編程上已經沒有辦法可走了,你可以考慮使用代理,通過代理服務器去獲取數據,查封就換個代理服務器。不過現在代理服務器是很難找的。
php採集程序問題
這個程序運行下來到你看到結果,涉及到的編碼有:
“” 對應網頁內容的編碼,
你php腳本文件的編碼,
你看到的輸出的內容的編碼,
如果是在瀏覽器中看的,還有瀏覽器解析輸出內容的編碼。
這一套流程走下來,如果中間有一步流程沒有匹配上的話,就會出現亂碼了。
不考慮4瀏覽器編碼的話,首先我們可以通過瀏覽器查看編碼的方法知道””用的是gbk編碼,然後你再看你輸出的編碼是否是gbk的,如果不是的話,就要用$con = mb_convert_encoding($con,’utf-8′,’gbk’);的方法來處理一下,然後再輸出,這樣應該就能看到正常的內容了
大家談談 面對驗證碼如何模擬登錄? – PHP進階討論
用PHP查找cookie,如果存在cookie並值正確則屏蔽驗證碼數據模塊就可以了
查看原帖
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/308746.html