我們通過元字符和原子完成了正則表達式的入門。但有一些特殊情況我們依然需要來處理。
如果abc在第二行的開始處如何匹配?
我不希望正則表達示特別貪婪的匹配全部,只匹配一部分怎么辦?
這個時候,我們就需要用到下面的這些模式匹配來增強正則的功能。
常用的模式匹配符有:
| 模式匹配符 | 功能 |
| -- | -- |
| i | 模式中的字符將同時匹配大小寫字母. |
| m | 字符串視為多行 |
| s | 將字符串視為單行,換行符作為普通字符. |
| x | 將模式中的空白忽略. |
| A | 強制僅從目標字符串的開頭開始匹配. |
| D | 模式中的美元元字符僅匹配目標字符串的結尾. |
| U | 匹配最近的字符串. |
模式匹配符的用法如下:
> / 正則表達示/模式匹配符
模式匹配符是放在這句話的最后的。例如:
> /\w+/s
格式我們清楚了,接下來最主要的是加強對于模式匹配符使用的理解和記憶。我們通過代碼來理解加上和不加模式匹配符有何區別。
###i 不區分大小寫
~~~
<?php
//在后面加上了一個i
$pattern = '/ABC/i';
$string = '8988abc12313';
$string1 = '11111ABC2222';
if(preg_match($pattern, $string, $matches)){
echo '匹配到了,結果為:';
var_dump($matches);
}else{
echo '沒有匹配到';
}
?>
~~~
結論,不論是$string還是$string1全都匹配成功了。因此,在后面加上了i之后,在匹配的時候可以不區分大小寫。
### m 視為多行
正則在匹配的時候,要匹配的目標字符串我們通常視為一行。
“行起始”元字符(^)僅僅匹配字符串的起始,“行結束”元字符($)僅僅匹配字符串的結束。
當設定了此修正符,“行起始”和“行結束”除了匹配整個字符串開頭和結束外,還分別匹配其中的換行符的之后和之前。
**注意:如果要匹配的字符串中沒有“\n”字符或者模式中沒有 ^ 或 $,則設定此修正符沒有任何效果。**
我們通過實驗和代碼來驗證一下這個特點:
第一次匹配,你會發現匹配不成功:
~~~
<?php
$pattern = '/^a\d+/';
$string = "我的未來在自己手中我需要不斷的努力
a9是一個不錯的字符表示
怎么辦呢,其實需要不斷奮進";
if (preg_match($pattern, $string, $matches)) {
echo '匹配到了,結果為:';
var_dump($matches);
} else {
echo '沒有匹配到';
}
~~~
第二次匹配,我們加上m 試試:
~~~
<?php
$pattern = '/^a\d+/m';
$string = "我的未來在自己手中我需要不斷的努力
a9是一個不錯的字符表示
怎么辦呢,其實需要不斷奮進";
if (preg_match($pattern, $string, $matches)) {
echo '匹配到了,結果為:';
var_dump($matches);
} else {
echo '沒有匹配到';
}
~~~
結果:
哦耶!匹配成功了。/^a\d+/ 匹配的內容是a9,必須得在行開始處。在第二行也被匹配成功了。

###s 視為一行
如果設定了此修正符,模式中的圓點元字符(.)匹配所有的字符,包括換行符。
第一次,不加模式匹配符s:
~~~
<?php
$pattern = '/新的未來.+\d+/';
$string = '新的未來
987654321';
if (preg_match($pattern, $string, $matches)) {
echo '匹配到了,結果為:';
var_dump($matches);
} else {
echo '沒有匹配到';
}
?>
~~~
第二次,在正則表達示后面加上模式匹配符s:
~~~
<?php
$pattern = '/新的未來.+\d+/s';
$string = "新的未來
987654321";
if (preg_match($pattern, $string, $matches)) {
echo '匹配到了,結果為:';
var_dump($matches);
} else {
echo '沒有匹配到';
}
?>
~~~
結果如下,匹配成功!

**結論:**
1. 因為在新的未來,未來后面有一個換行
2. 而.(點)是匹配非空白字符以外的所有字符。因此,第一次不成功
3. 第二次,加上了s模式匹配符。因為,加上后.(點)能匹配所有字符。
###x 忽略空白字符
1. 如果設定了此修正符,模式中的空白字符除了被轉義的或在字符類中的以外完全被忽略。
2. 未轉義的字符類外部的#字符和下一個換行符之間的字符也被忽略。
我們先來實驗一下忽略空白行等特性:
~~~
<?php
$pattern = '/a b c /x';
$string = '學英語要從abc開始';
if (preg_match($pattern, $string, $matches)) {
echo '匹配到了,結果為:';
var_dump($matches);
} else {
echo '沒有匹配到';
}
?>
~~~
這樣也能匹配成功。

在$pattern里面有空格,每個abc后面有一個空格。而$string里面沒有空格。
所以x忽略空白字符。
而第二句話從字面上比較難理解,
~~~
<?php
//重點觀察這一行
$pattern = '/a b c #我來寫一個注釋
/x';
$string = '學英語要從abc開始';
if (preg_match($pattern, $string, $matches)) {
echo '匹配到了,結果為:';
var_dump($matches);
} else {
echo '沒有匹配到';
}
?>
~~~
結果也匹配成功了!

我們發現,x的第二個特性是忽略:#字符和下一個換行符之間的字符也被忽略。
###e 將匹配項找出來,進行替換
* e模式也叫逆向引用。主要的功能是將正則表達式括號里的內容取出來,放到替換項里面替換原字符串。
* 使用這個模式匹配符前必須要使用到preg_replace()。
> mixed preg_replace ( mixed $正則匹配項 , mixed $替換項 , mixed $查找字符串)
* preg_replace的功能:使用$正則匹配項變,找到$查找字符串變量。然后用$替換項變量進行替換。
在正式講解前我們回顧一下之前的知識,我們故意把每個要匹配的原子外面都加上括號:
~~~
<?php
//加上了括號
$pattern = '/(\d+)([a-z]+)(\d+)/';
$string = '987abc321';
if (preg_match($pattern, $string, $match)) {
echo '匹配到了,結果為:';
var_dump($match);
} else {
echo '沒有匹配到';
}
?>
~~~
我們來看看結果:

這是我們之前講括號的時候:匹配到的內容外面有括號。會把括號里面的內容,也放到數組的元素里面。如圖中的:987、abc、321。
我們接下來看正則表達示中的e模式:
~~~
<?php
$string = "{April 15, 2003}";
//'w'匹配字母,數字和下劃線,'d'匹配0-99數字,'+'元字符規定其前導字符必須在目標對象中連續出現一次或多次
$pattern = "/{(\w+) (\d+), (\d+)}/i";
$replacement = "\$2";
//字符串被替換為與第 n 個被捕獲的括號內的子模式所匹配的文本
echo preg_replace($pattern, $replacement, $string);
?>
~~~
我們看看執行結果:

結論:
1. 上例中\$2 指向的是正則表達示的第一個(\d+)。相當于把15又取出來了
2. 替換的時候,我寫上\$2。將匹配項取出來,用來再次替換匹配的結果。
###U 貪婪模式控制
正則表達式默認是貪婪的,也就是盡可能的最大限度匹配。
我們來看看正則表達示是如何貪婪的:
~~~
<?php
$pattern = '/<div>.*<\/div>/';
$string = "<div>你好</div><div>我是</div>";
if (preg_match($pattern, $string, $match)) {
echo '匹配到了,結果為:';
var_dump($match);
} else {
echo '沒有匹配到';
}
?>
~~~
我們來看看結果,得到如下結論。它從“<div>你好”直接匹配到了“我是</div>”。進行了最大范圍的匹配。

同樣一段代碼我們再加大寫的U,再看看效果:
~~~
<?php
$pattern = '/<div>.*<\/div>/U';
$string = "<div>你好</div><div>我是</div>";
if (preg_match($pattern, $string, $match)) {
echo '匹配到了,結果為:';
var_dump($match);
} else {
echo '沒有匹配到';
}
?>
~~~

我們發現,只匹配出來了:
~~~
<div>你好</div>
~~~
這樣,把正則的貪婪特性取消掉。讓它找到了最近的匹配,就OK了。
###A 從目標字符串的開頭開始匹配
此模式類似于元字符中的^(抑揚符)效果。
~~~
<?php
$pattern = '/this/A';
$string = 'hello this is a ';
//$string1 = 'this is a ';
if (preg_match($pattern, $string, $match)) {
echo '匹配到了,結果為:';
var_dump($match);
} else {
echo '沒有匹配到';
}
?>
~~~
結論:
1. 如果加A模式修正符的時候匹配不出來$string,不加時能匹配出來
2. 如果加上了A模式修正符的時候能匹配出來$string1,因為必須要從開始處開始匹配
### D 結束$符后不準有回車
如果設定了此修正符,模式中的美元元字符僅匹配目標字符串的結尾。沒有此選項時,如果最后一個字符是換行符的話,美元符號也會匹配此字符之前。
~~~
<?php
$pattern = '/\w+this$/';
//$pattern1 = '/\w+this$/D';
$string = "hellothis
";
if (preg_match($pattern, $string, $match)) {
echo '匹配到了,結果為:';
var_dump($match);
} else {
echo '沒有匹配到';
}
?>
~~~
結果展示:

結論:
1. 如pattern 在匹配$string的時候,$string的字符串this后有一個回車。在沒有加D匹配符的時候也能匹配成功
2. 如pattern 在匹配$string的時候,加上了D。$string的字符串this后有空格,匹配不成功。
- 01. 為什么選擇本書學習PHP
- 1.1 為什么學習PHP?
- 1.2 PHP是什么
- 1.3 零基礎也能學習
- 1.4 為什么有些人學不會
- 02.PHP的環境安裝
- 2.1開發環境是什么?
- 2.2 windows環境安裝
- 2.3 Linux環境安裝
- 2.4 其他開發環境
- 2.5 寫代碼的工具選擇
- 03. PHP基本語法
- 3.1 PHP基本語法
- 3.1.1 寫出你的第一段PHP代碼
- 3.1.2 讀過初中你就會變量
- 3.1.3 echo 顯示命令
- 3.1.4 注釋的功能很強大
- 3.2 數據類型并不神秘
- 3.2.1 整型就是整數
- 3.2.2 布爾就是易經的知識
- 3.2.3 字符串
- 3.2.4 浮點型
- 3.2.5 重要:if和else語法
- 3.2.6 NULL類型
- 3.2.7對象以后會學
- 3.2.8 數組會有單純的一個章節
- 3.2.9 資源類型
- 3.2.10 眼前了解回調類型即可
- 3.2.11 查看和判斷數據類型
- 3.2.12 數據類型的自動轉換和強制轉換
- 3.3 常量和變量
- 3.3.1 用常量限制用戶跳過某些文件
- 3.3.2 可變變量
- 3.3.3 外部變量
- 3.3.4 環境變量
- 3.3.5 變量引用
- 3.4 PHP表達式與運算符
- 3.4.1 算術運算
- 3.4.2 賦值運算
- 3.4.3 自加、自減運算
- 3.4.4 比較運算
- 3.4.5 邏輯運算
- 3.4.6 位運算
- 3.4.7 運算符優先級
- 3.4.8 三元運算符和其它運算符
- 04. PHP中的流程控制
- 4.1 if條件結構流程
- 4.1.1 if語句
- 4.1.2 嵌套if...else...elseif結構
- 4.1.3 if語句多種嵌套
- 4.2 分支結構switch語句的使用
- 4.3 循環語句的使用
- 4.3.1 while循環
- 4.3.2 do...while循環的區別
- 4.3.3 for循環控制語句
- 4.3.4 goto語法
- 4.3.5 declare 語法
- 05.PHP的函數基本語法
- 5.1 自定義函數
- 5.2 自定義函數高級調用
- 5.2.1 回調函數
- 5.2.2 變量函數
- 5.2.3 匿名函數
- 5.2.4 內部函數
- 5.2.5 變量作用域
- 5.2.6 參數的引用
- 5.2.7 遞歸函數
- 5.2.8 靜態變量
- 5.3 使用系統內置函數
- 5.4 文件包含函數
- 5.5 數學常用函數
- 5.6 日期常用函數
- 5.6.1 獲取時期時間信息函數
- 5.6.2 日期驗證函數
- 5.6.3 獲取本地化時間戳函數
- 5.6.4 程序執行時間檢測
- 5.7 字符串常用函數
- 06.PHP數組與數據結構
- 6.1 數組的定義
- 6.2 數組的操作
- 6.2.1 數組的計算
- 6.2.2 for循環遍歷索引數組
- 6.2.3 foreach遍歷關聯數組
- 6.2.4 list、each函數遍歷數組
- 6.2.5 常用操作數組函數
- 6.3 數組的常用函數
- 07. PHP中的正則達達式
- 7.1 正則表達示的定界符
- 7.2 正則表達示中的原子
- 7.3 正則表示中的元字符
- 7.4 正則達達示中的模式修正符
- 7.5 寫正則的訣竅和常用正則
- 7.6 用正則寫一個UBB文本編輯器
- 08.文件系統
- 8.1 讀取文件
- 8.2 創建和修改文件內容
- 8.3 創建臨時文件
- 8.4 移動、拷貝和刪除文件
- 8.5 檢測文件屬性函數
- 8.6 文件常用函數和常量
- 8.7 文件鎖處機制
- 8.8 目錄處理函數
- 8.9 文件權限設置
- 8.10文件路徑函數
- 8.11 小小文件留言本
- 8.12 修改配置文件的實例
- 09.PHP文件上傳
- 9.1 文件上傳需要注意php.ini文件
- 9.2 文件上傳的步驟
- 9.3 文件上傳表單注意事項
- 9.4 按照數組和步驟完成文件上傳
- 9.5 多文件上傳
- 9.6 文件上傳進度處理
- 10.PHP圖像處理
- 10.1 學習前的準備工作
- 10.2 用圖片處理函數畫一張圖
- 10.3 生成驗證碼
- 10.4 圖像縮放和裁剪技術
- 10.5 圖片水印處理
- 11.錯誤處理
- 11.1 禁止顯示錯誤
- 11.2 錯誤報告級別
- 11.3 錯誤記錄日志
- 11.4 自定義錯誤處理函數
- 12.MySQL 入門
- 12.1 請進入《MySQL入門》
- 13. PHP操作mysql數據庫
- 13.1 數據庫連接步驟
- 13.2 通過步驟做一個用戶注冊
- 13.3 通過步驟做一個列表顯示
- 13.4 把用戶做個分頁
- 13.5 批量和指定刪除用戶
- 13.6 修改用戶信息
- 13.7 數據顯示亂碼終極解決辦法
- 14.會話管理和控制
- 14.1 Cookie概述
- 14.2PHP中的Cookie
- 14.3 session概述
- 14.4 PHP中使用session
- 14.5 SESSION應用實例
- 15.通過cURL來做小偷程序
- 15.1 curl的使用步驟
- 15.2 自定義get方法抓取網頁
- 15.3 使用post發送數據
- 16. 用PHP寫一個論壇
- 16.1 web2.0始于論壇
- 16.2 需求:開發前你要知道他的樣子
- 16.3 核心業務流程
- 16.3.1 用戶注冊流程
- 16.3.2 普通用戶和管理員登陸流程
- 16.3.3 發貼流程
- 16.3.4 回復流程
- 16.3.5 版塊管理流程
- 16.3.6 版主業務流程
- 16.3.7 金幣獎勵和消耗流程
- 16.4 數據庫表設計
- 16.5 文件和代碼規范
- 16.6 核心功能說明
- 16.6.1 項目目錄結構說明
- 16.6.2 公共文件的使用
- 16.6.3 模板引擎講解
- 16.6.4 用戶注冊、登陸功能講解
- 16.6.5 發帖功能講解
- 16.6.6 回帖功能講解
- 16.6.7 項目安裝模塊講解
- 附錄1. 版權聲明
- 附錄2 . 學習PHP常用的英文單詞