本文目錄一覽:
- 1、php preg_match匹配 字符
- 2、php數組[0],[1],[2]分別是什麼意思?
- 3、php函數preg_match參數含義
- 4、PHP函數preg_match_all正則表達式的基本使用詳細解析
- 5、PHP中preg_match()和preg_replace()的一些問題
php preg_match匹配 字符
$str = ”;
preg_match_all(‘/(images\/{2}\d+\/{1}*.jpg)/i’, $str, $src);
print_r($src);
php數組[0],[1],[2]分別是什麼意思?
這個是正則表達式中的“反向引用”,用以匹配特定的“局部內容”,
在這裡$match[2]是一個數組,數組的內容為”aaa” ,”cccc”;
php函數preg_match參數含義
是一個正則表達式,例如*代表任意+d代表正整數等等,更多的信息你要查看關於正則方面的資料~
PHP函數preg_match_all正則表達式的基本使用詳細解析
了解正則表達式之前,須要掌握一些常用的正則表達式的基礎知識,這些如果能記得最好記得,記不住須要用的時候能查到就行,就多個特殊字符,所以說正則表達式玩的就是特殊,具體大家可以查看更加細緻的說明。
preg_match_all函數具體說明大家可以查看PHP手冊,本文運用
preg_match_all用於測試正則表達的效果。
實例代碼:
複製代碼
代碼如下:
$html
=
‘div
id=”biuuu”jb51.net/divdiv
id=”biuuu_2″jb51.net2/divdiv
id=”biuuu_3″jb51.net3/div’;
實例要求:分別將每一個DIV元素的ID和內容取出,如biuuu,biuuu_2,biuuu_3,jb51.net,jb51.net2和jb51.net3(一些常用的抓站要領就是這樣匹配的)
分析:字符串是一個基本的HTML元素,每一個DIV元素對應該一個ID和內容,並且是獨立的,首先考慮如何
取出一個DIV內的ID值和內容,如:jb51.net,然後匹配其它類似的元素。一個DIV中須要取出兩個值,也就是兩個匹配的表達式,第一個表達式用於匹配ID值(biuuu),第二個表達式用於匹配ID的內容(jb51.net),正則表達式常用的表達式運用小括號,那麼前面的元素將會變成如下形式:
div
id=”(biuuu)”(jb51.net)/div
div
id=”(表達式1)”(表達式2)/div
好,運用如上小括號把須要匹配的區域執行
了劃分,接下來就是如何
匹配各個表達式內的內容,我們猜想一個ID可能是字母,數字或下劃線,那這就變得基本了,運用中括號就可以實現,如下:
表達式1:[a-zA-Z0-9_]+
(表示匹配大小寫字母,數字和下劃線)
那如何
匹配表達式2,因為ID的內容可以是任意的字符,但是要留心,不能匹配或字符,因為如果匹配這兩個字符將會把後面運用的DIV都匹配出來,因此須要排除這兩個字符開始的元素,也就是不匹配以或字符,如下:
表達式2:[^]+
(表示不匹配和字符)
這樣,須要匹配的子表達式就實現了,但是還要須要匹配一個
的表達式,要領如下:
表達式:/
‘\”(表達式1)\”‘(表達式2)\/div/
留心其中的雙引號”和/須要運用
\轉義字符轉義,然後把前面兩個表達式放進去,
如下:
‘\”([a-z0-9_]+)\”‘/div
id=\”([a-z0-9_]+)\”([^]+)\/div/
這樣就實現一個匹配每一個DIV元素ID值和內容的正則表達式,然後運用
preg_match_all函數測試如下:
複製代碼
代碼如下:
$html
=
‘div
id=”biuuu”jb51.net/divdiv
id=”biuuu_2″jb51.net2/divdiv
id=”biuuu_3″jb51.net3/div’;
preg_match_all(‘/div\sid=\”([a-z0-9_]+)\”([^]+)\/div/’,$html,$result);
var_dump($result);
結果:
複製代碼
代碼如下:
array(3)
{
[0]=
array(3)
{
[0]=
string(30)
“div
id=”biuuu”jb51.net/div”
[1]=
string(33)
“div
id=”biuuu_2″jb51.net2/div”
[2]=
string(33)
“div
id=”biuuu_3″jb51.net3/div”
}
[1]=
array(3)
{
[0]=
string(5)
“biuuu”
[1]=
string(7)
“biuuu_2”
[2]=
string(7)
“biuuu_3”
}
[2]=
array(3)
{
[0]=
string(8)
“jb51.net”
[1]=
string(9)
“jb51.net2”
[2]=
string(9)
“jb51.net3”
}
}
共有三個表達式,分別顯示每一個表達式匹配的值,並以數組的形式存儲,這樣就把每一個DIV元素的ID和內容取出。運用正則表達式最主要還是要知道須要什麼,然後跟椐須要執行
匹配,並且思路清晰,並適當的藉助preg_match_all函數執行
輸出調試,非常方便。
PHP中preg_match()和preg_replace()的一些問題
(一)當中的!是正則表達式(簡稱正則式)的分割界定符號。意味着開始的!和第二個!之間是正則式的【主式】(為了便於你理解,不得不這麼做個偽定義),我們大多數時候都喜歡用“/”作為分割界定符號,因為在(一)中,剛好已經有“/”在【主式】中了。第二個!後面的isU等,是正則式的修正符,至於各個修正符的用法和作用,強烈建議你去查看PHP手冊。
(二)這個[1]中的1,代表着匹配到結果賦值給$outputs後,$outputs數組的下標為1的值,就是前面【主式】中”(*)”匹配到的內容。
(三)第三個,是正則式中“\”轉義符號的用法體現。在正則式中“.”是匹配所有字符的(暫不考慮修正符模式),“\.”卻可以匹配“.”了。在這個正則式中,\/wap\.php將會匹配到“/wap.php”,並用“index.php”去替換掉它。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/187203.html