本文目錄一覽:
php抓取網頁指定的內容
我給你一個思路, 代碼我也不會給的, 會被百度刪的.
抓取網上的數據, 一般用正則去匹配. 你可以匹配開頭為div class=”so_weather”的, 然後匹配結尾. 結尾盡量是這個開頭div的下一個同級div, 如div id=”asda”, 這樣. 然後得到的數據用strip_tags函數將html代碼都去了, 得到的結果就是你想要的
PHP抓取網頁指定內容
?php
/*
* 如下: 方法有點笨
* 抓取網頁內容用 PHP 的正則
* 用JS每隔5分鐘刷新當前頁面—即重新獲取網頁內容
*
* 註: $mode中–title/title-更改為所需內容(如 $mode = “#a(.*)/a#”;獲取所有鏈接)
*
* window.location.href=””;中的
* 更改為自己的URL—-作用:即刷新當前頁面
*
* setInterval(“ref()”,300000);是每隔300000毫秒(即 5 * 60 *1000 毫秒即5分鐘)執行一次函數 ref()
*
* print_r($arr);輸出獲得的所有內容 $arr是一個數組 可根據所需輸出一部分(如 echo $arr[1][0];)
* 若要獲得所有內容 可去掉
* $mode = “#title(.*)/title#”;
if(preg_match_all($mode,$content,$arr)){
print_r($arr);
echo “br/”;
echo $arr[1][0];
}
再加上 echo $content;
*/
$url = “”; //目標站
$fp = @fopen($url, “r”) or die(“超時”);
$content=file_get_contents($url);
$mode = “#title(.*)/title#”;
if(preg_match_all($mode,$content,$arr)){
//print_r($arr);
echo “br/”;
echo $arr[1][0];
}
?
script language=”JavaScript” type=”text/javascript”
—
function ref(){
window.location.href=””;
}
setInterval(“ref()”,300000);
//–
/script
PHP獲取網頁內容的幾種方法
簡單的收集下PHP下獲取網頁內容的幾種方法:
用file_get_contents,以get方式獲取內容。
用fopen打開url,以get方式獲取內容。
使用curl庫,使用curl庫之前,可能需要查看一下php.ini是否已經打開了curl擴展。
用file_get_contents函數,以post方式獲取url。
用fopen打開url,以post方式獲取內容。
用fsockopen函數打開url,獲取完整的數據,包括header和body。
php用正規表達式獲取網頁指定內容
?php
$str
=
str
th1/th
td
class=”key”a
href=”網址1″
target=”_blank”你要的地址1/a/td
th2/th
td
class=”key”a
href=”網址2″
target=”_blank”你要的地址2/a/td
th3/th
td
class=”key”a
href=”網址3″
target=”_blank”你要的地址3/a/td
th4/th
td
class=”key”a
href=”網址4″
target=”_blank”你要的地址4/a/td
th5/th
td
class=”key”a
href=”網址5″
target=”_blank”你要的地址5/a/td
str;
$p
=
‘#td
class=”key”a
href=”(.*)”
target=”_blank”(.*)/a/td#iUs’;
preg_match_all($p,$str,$ar);
print_r($ar[0]);
?
$ar[0]
的所有值就是你想要的地址了
測試過
沒問題
PHP採集網頁中指定的內容
你如果是單個頁面的話不需要正規表達式,只要找到自己需要的部分看看前面和後面有什麼唯一性的標識,截取出來就可以了。
原創文章,作者:MPEK,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/139484.html