《PHP實戰:PHP正則表達式之捕獲組與非捕獲組》要點:
本文介紹了PHP實戰:PHP正則表達式之捕獲組與非捕獲組,希望對您有用。如果有疑問,可以聯系我們。
今天遇到一個正則匹配的問題,忽然翻到有捕獲組的概念,手冊上也是一略而過,百度時無意翻到C#和Java中有對正則捕獲組的特殊用法,搜索關鍵詞有PHP時竟然沒有相關內容,自己試了一下,發現在PHP中也是可行的,于是總結一下,分享的同時也希望有大神和細心的學習者找到我理解中出現的問題.PHP編程
什么是捕獲組PHP編程
捕獲組語法:PHP編程
字符?PHP編程 |
描述PHP編程 |
示例PHP編程 |
(pattern)PHP編程 |
匹配pattern并捕獲結果,自動設置組號.PHP編程 |
?(abc)+dPHP編程 匹配abcd或者abcabcdPHP編程 |
(?<name>pattern)PHP編程 或PHP編程 (?'name'pattern)PHP編程 |
匹配pattern并捕獲結果,設置name為組名.PHP編程 |
?PHP編程 |
\numPHP編程 |
對捕獲組的反向引用.其中 num 是一個正整數.PHP編程 |
(\w)(\w)\2\1PHP編程 匹配abbaPHP編程 |
\k<?name?>PHP編程 或PHP編程 \k'?name?'PHP編程 |
對命名捕獲組的反向引用.其中 name 是捕獲組名.PHP編程 |
(?<group>\w)abc\k<group>PHP編程 匹配xabcxPHP編程 |
我們先看一下PHP的正則匹配函數PHP編程
int preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] )
前面兩項是我們常用的,$pattern是正則匹配模式,$string是要匹配的字符串.PHP編程
array &$match,它是一個數組,&表示匹配出來的結果會被寫入$match中.PHP編程
int $flags 如果傳遞了這個標記, 對于每一個出現的匹配返回時會附加字符串偏移量(相對于目標字符串的).PHP編程
int $offset 用于指定從目標字符串的某個未知開始搜索(單位是字節).PHP編程
我們主要看一下$match的值里會有什么:PHP編程
$mode = '/a=(\d+)b=(\d+)c=(\d+)/'; $str='**a=4b=98c=56**'; $res=preg_match($mode,$str,$match); var_dump($match);
結果如下:PHP編程
array (size=4)
? 0 => string 'a=4b=98c=56' (length=11)
? 1 => string '4' (length=1)
? 2 => string '98' (length=2)
? 3 => string '56' (length=2)PHP編程
現在我們知道了什么是捕獲組,捕獲組是正則表達示中以()括起來的部分,每一對()是一個捕獲組.PHP編程
PHP會為它編號,從1開始.至于為什么會從1開始,那是因為PHP把匹配到的完整字符串編號為0.PHP編程
如果有多個括號或嵌套括號,按左邊括號出現的順序來進行編號,如圖:PHP編程
PHP編程
按圖中的匹配模式匹配時,捕獲組的123號分別是紅綠藍.PHP編程
捕獲組的忽略與命名PHP編程
我們還可以阻止PHP為匹配組的編號:在匹配組中模式前加? ?:PHP編程
$mode = '/a=(\d+)b=(?:\d+)c=(\d+)/';
這樣,匹配結果就會變成:PHP編程
array (size=3) 0 => string 'a=4b=98c=56' (length=11) 1 => string '4' (length=1) 2 => string '56' (length=2)
當然,我們也可以在括號的內部為它給它獨特的名字.PHP編程
命名子組可以接受(?<name>), (?'name') 以及(?P<name>)語法. 之前版本僅接受(?P<name>)語法.PHP編程
例如:$mode = '/a=(\d+)b=(?P<sec>\d+)c=(\d+)/';PHP編程
使用時結果為:PHP編程
array (size=5) 0 => string 'a=4b=98c=56' (length=11) 1 => string '4' (length=1) 'sec' => string '98' (length=2) 2 => string '98' (length=2) 3 => string '56' (length=2)
在保留索引數組的同時,加上一個關聯項,key值為捕獲組名.PHP編程
捕獲組的反向引用PHP編程
我們在用preg_replace()函數進行正則替換時,我們還可以使用 \n 或 $n 來引用第n個捕獲組.PHP編程
$mode = '/a=(\d+)b=(\d+)c=(\d+)/'; $str='**a=4b=98c=56**'; $rp='\1/$2/\3/'; echo preg_replace($mode,$rp,$str);//**4/98/56/**
\1表示捕獲組1(4),$2為捕獲組2(98),\3為捕獲組3(56).PHP編程
非捕獲組的用法:PHP編程
非捕獲組語法:PHP編程
字符?PHP編程 |
描述PHP編程 |
示例PHP編程 |
(?:pattern)PHP編程 |
匹配pattern,但不捕獲匹配結果.PHP編程 |
'industr(?:y|ies)PHP編程 匹配'industry'或'industries'.PHP編程 |
(?=pattern)PHP編程 |
零寬度正向預查,不捕獲匹配結果.PHP編程 |
'Windows (?=95|98|NT|2000)'PHP編程 匹配 "Windows2000" 中的 "Windows"PHP編程 不匹配 "Windows3.1" 中的 "Windows".PHP編程 |
(?!pattern)PHP編程 |
零寬度負向預查,不捕獲匹配結果.PHP編程 |
'Windows (?!95|98|NT|2000)'PHP編程 匹配 "Windows3.1" 中的 "Windows"PHP編程 不匹配 "Windows2000" 中的 "Windows".PHP編程 |
(?<=pattern)PHP編程 |
零寬度正向回查,不捕獲匹配結果.PHP編程 |
'2000 (?<=Office|Word|Excel)'PHP編程 匹配 " Office2000" 中的 "2000"PHP編程 不匹配 "Windows2000" 中的 "2000".PHP編程 |
(?<!pattern)PHP編程 |
零寬度負向回查,不捕獲匹配結果.PHP編程 |
'2000 (?<!Office|Word|Excel)'PHP編程 匹配 " Windows2000" 中的 "2000"PHP編程 不匹配 " Office2000" 中的 "2000".PHP編程 |
為什么稱為非捕獲組呢?那是因為它們有捕獲組的特性,在匹配模式的()中,但是匹配時,PHP不會為它們編組,它們只會影響匹配結果,并不作為結果輸出.PHP編程
/d(?=xxx)??? 匹配"后面是xxx的一個數字".PHP編程
注意格式:只能放在匹配模式字符串之后!PHP編程
例如:PHP編程
$pattern='/\d(?=abc)/'; $str="ab36abc8eg"; $res=preg_match($pattern,$str,$match); var_dump($match);//6
匹配的6,因為只有它作為一個數字,后面還有abc.PHP編程
(?<=xxx) /d 匹配"前面是xxx的一個數字"PHP編程
注意格式:只能放在匹配模式字符串之前!PHP編程
例如:PHP編程
$pattern='/(?<=abc)\d/'; $str="ab36abc8eg"; $res=preg_match($pattern,$str,$match); var_dump($match);//8
匹配的8,因為只有它作為一個數字,后面還有abc.PHP編程
與(?=xxx)? (?<=xxx)相對的是(?!=xxx)? (?<!=xxx) 它們在=前加了非運算符 “!”PHP編程
它表示前面/后面不是xxx的字符串,這里就不再舉例了.PHP編程
如果您覺得本博文對您有贊助,您可以推薦或關注我,如果您有什么問題,可以在下方留言討論,謝謝.PHP編程
維易PHP培訓學院每天發布《PHP實戰:PHP正則表達式之捕獲組與非捕獲組》等實戰技能,PHP、MYSQL、LINUX、APP、JS,CSS全面培養人才。
轉載請注明本頁網址:
http://www.snjht.com/jiaocheng/8446.html