本文目录一览:
- 1、php curl登陆和获取内容类,请各位高手看怎么使用
- 2、用php的Snoopy如何抓取网页的验证码呢?
- 3、php伪造ip获取网页内容,求高手
- 4、php采集程序问题
- 5、大家谈谈 面对验证码如何模拟登录? – PHP进阶讨论
php curl登陆和获取内容类,请各位高手看怎么使用
由于每个网站的信息不一样,没有通用的curl的。等看你的具体需求,若你要模拟登录可以看下snoopy,一个基于curl的类,抓取信息可以用querylist
用php的Snoopy如何抓取网页的验证码呢?
curl就可以了
?php
header(‘Content-Type:image/png’);
$url = “图片链接”;//图片链接
$ch = curl_init();
//Cookie:PHPSESSID=121b1127dcded8702c6a1e702c40eca4
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch,CURLOPT_COOKIE,’这里是你的cookies’);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 0);
curl_setopt($ch, CURLOPT_TIMEOUT,0);//忽略超时
curl_setopt($ch, CURLOPT_NOBODY, false);
$str = curl_exec($ch);
curl_close($ch);
php伪造ip获取网页内容,求高手
伪造IP是不可能的,HTTP协议是机遇TCP,你发送GET命令过去必须留有准确的IP地址,否则对方无法把结果发给你,你与服务器xxx.xxx.xx的通讯相当于写信,你匿名写信只能攻击,要获取返回的东西必须提交真实的地址。
无论使用CURL还是别的方法,都要受前面的基本规则限制。
编程上已经没有办法可走了,你可以考虑使用代理,通过代理服务器去获取数据,查封就换个代理服务器。不过现在代理服务器是很难找的。
php采集程序问题
这个程序运行下来到你看到结果,涉及到的编码有:
“” 对应网页内容的编码,
你php脚本文件的编码,
你看到的输出的内容的编码,
如果是在浏览器中看的,还有浏览器解析输出内容的编码。
这一套流程走下来,如果中间有一步流程没有匹配上的话,就会出现乱码了。
不考虑4浏览器编码的话,首先我们可以通过浏览器查看编码的方法知道””用的是gbk编码,然后你再看你输出的编码是否是gbk的,如果不是的话,就要用$con = mb_convert_encoding($con,’utf-8′,’gbk’);的方法来处理一下,然后再输出,这样应该就能看到正常的内容了
大家谈谈 面对验证码如何模拟登录? – PHP进阶讨论
用PHP查找cookie,如果存在cookie并值正确则屏蔽验证码数据模块就可以了
查看原帖
原创文章,作者:小蓝,如若转载,请注明出处:https://www.506064.com/n/308746.html