# 17.2.?`plural.py`, 第 1 階段
你所針對的單詞 (至少在英語中) 是字符串和字符。你還需要規則來找出不同的字符 (字母) 組合,并對它們進行不同的操作。這聽起來像是正則表達式的工作。
## 例?17.1.?`plural1.py`
```
import re
def plural(noun):
if re.search('[sxz]$', noun):
return re.sub('$', 'es', noun)
elif re.search('[^aeioudgkprt]h$', noun):
return re.sub('$', 'es', noun)
elif re.search('[^aeiou]y$', noun):
return re.sub('y$', 'ies', noun)
else:
return noun + 's'
```
| | |
| --- | --- |
| \[1\] | 好啦,這是一個正則表達式,但是它使用了你在 [第?7?章 _正則表達式_](../regular_expressions/index.html "第?7?章?正則表達式") 中未曾見過的語法。方括號的意思是 “完全匹配這些字符中的一個”。也就是說,`[sxz]` 意味著 “`s`,或者 `x`,再或者 `z`”,但只是其中的一個。`$` 應該不陌生,它意味著匹配字符串的結尾。也就是說,檢查 `noun` 是否以 `s`,`x`,或者 `z` 結尾。 |
| \[2\] | `re.sub` 函數進行以正則表達式為基礎的替換工作。讓我們更具體地看看它。 |
## 例?17.2.?`re.sub` 介紹
```
>>> import re
>>> re.search('[abc]', 'Mark')
<_sre.SRE_Match object at 0x001C1FA8>
>>> re.sub('[abc]', 'o', 'Mark')
'Mork'
>>> re.sub('[abc]', 'o', 'rock')
'rook'
>>> re.sub('[abc]', 'o', 'caps')
'oops'
```
| | |
| --- | --- |
| \[1\] | `Mark` 包含 `a`,`b`,或者 `c`嗎?是的,含有 `a`。 |
| \[2\] | 好的,現在找出 `a`,`b`,或者 `c` 并以 `o` 取代之。`Mark` 就變成 `Mork` 了。 |
| \[3\] | 同一方法可以將 `rock` 變成 `rook`。 |
| \[4\] | 你可能認為它可以將 `caps` 變成 `oaps`,但事實并非如此。`re.sub` 替換_所有_ 的匹配項,并不只是第一個匹配項。因此正則表達式將會把 `caps` 變成 `oops`,因為 `c` 和 `a` 都被轉換為 `o`了。 |
## 例?17.3.?回到 `plural1.py`
```
import re
def plural(noun):
if re.search('[sxz]$', noun):
return re.sub('$', 'es', noun)
elif re.search('[^aeioudgkprt]h$', noun):
return re.sub('$', 'es', noun)
elif re.search('[^aeiou]y$', noun):
return re.sub('y$', 'ies', noun)
else:
return noun + 's'
```
| | |
| --- | --- |
| \[1\] | 回到 `plural` 函數。你在做什么?你在以 `es` 取代字符串的結尾。換句話說,追加 `es` 到字符串。你可以通過字符串拼合做到相同的事,例如 `noun + 'es'`,但是我使用正則表達式做這一切,既是為了保持一致,也是為了本章稍后你會明白的其它原因。 |
| \[2\] | 仔細看看,這是另一個新的內容。`^` 是方括號里面的第一個字符,這有特別的含義:否定。`[^abc]` 意味著 “ 除 `a`、 `b`、 和 `c` _以外的_ 任意單字符”。所以,`[^aeioudgkprt]` 意味著除 `a`、 `e`、 `i`、 `o`、 `u`、 `d`、 `g`、 `k`、 `p`、 `r` 和 `t` 以外的任意字符。這個字符之后應該跟著一個 `h`,然后是字符串的結尾。你在尋找的是以發音的 H 結尾的單詞。 |
| \[3\] | 這是一個相似的表達:匹配 Y 前面_不是_ `a`、 `e`、 `i`、 `o` 和 `u`,并以這個 Y 結尾的單詞。你在查找的是以發 I 音的 Y 結尾的單詞。 |
## 例?17.4.?正則表達式中否定的更多應用
```
>>> import re
>>> re.search('[^aeiou]y$', 'vacancy')
<_sre.SRE_Match object at 0x001C1FA8>
>>> re.search('[^aeiou]y$', 'boy')
>>>
>>> re.search('[^aeiou]y$', 'day')
>>>
>>> re.search('[^aeiou]y$', 'pita')
>>>
```
| | |
| --- | --- |
| \[1\] | `vacancy` 匹配這個正則表達式,因為它以 `cy` 結尾,并且 `c` 不在 `a`、 `e`、 `i`、 `o` 和 `u` 之列。 |
| \[2\] | `boy` 不能匹配,因為它以 `oy` 結尾,并且你特別指出 `y` 之前的字符不可以是 `o`。`day` 不能匹配是因為以 `ay` 結尾。 |
| \[3\] | `pita` 不匹配是因為不以 `y` 結尾。 |
## 例?17.5.?更多的 `re.sub`
```
>>> re.sub('y$', 'ies', 'vacancy')
'vacancies'
>>> re.sub('y$', 'ies', 'agency')
'agencies'
>>> re.sub('([^aeiou])y$', r'\1ies', 'vacancy')
'vacancies'
```
| | |
| --- | --- |
| \[1\] | 正則表達式把 `vacancy` 變為 `vacancies`,把 `agency` 變為 `agencies`,這正是你想要的。注意,將 `boy` 變成 `boies` 是可行的,但是永遠不會發生,因為 `re.search` 首先確定是否應該應用 `re.sub`。 |
| \[2\] | 順便提一下,可以將兩個正則表達式 (一個確定規則適用與否,一個應用規則) 合并在一起成為一個正則表達式。這便是合并后的樣子。它的大部分已經很熟悉:你應用的是在 [第?7.6?節 “個案研究:解析電話號碼”](../regular_expressions/phone_numbers.html "7.6.?個案研究:解析電話號碼") 學過的記憶組 (remembered group) 記住 `y` 之前的字符。然后再替換字符串,你使用一個新的語法 `\1`,這意味著:“嘿!記得前面的第一個組嗎?把它放這兒”。就此而言,記住了 `y` 之前的 `c` ,然后你做替換工作,你將 `c` 替換到 `c` 的位置,并將 `ies` 替換到 `y` 的位置。(如果你有不止一個組則可以使用 `\2` 或者 `\3` 等等。) |
正則表達式替換非常強大,并且 `\1` 語法使之更加強大。但是將整個操作放在一個正則表達式中仍然晦澀難懂,也不能與前面描述的復數規則直接呼應。你原來列出的規則,比如 “如果單詞以 S,X 或者 Z 結尾,結尾追加 ES”。如果你在函數中看到兩行代碼描述 “如果單詞以 S,X 或者 Z 結尾,結尾追加 ES”,更加直觀些。
- 版權信息
- 第?1?章?安裝 Python
- 1.1.?哪一種 Python 適合您?
- 1.2.?Windows 上的 Python
- 1.3.?Mac OS X 上的 Python
- 1.4.?Mac OS 9 上的 Python
- 1.5.?RedHat Linux 上的 Python
- 1.6.?Debian GNU/Linux 上的 Python
- 1.7.?從源代碼安裝 Python
- 1.8.?使用 Python 的交互 Shell
- 1.9.?小結
- 第?2?章?第一個 Python 程序
- 2.1.?概覽
- 2.2.?函數聲明
- 2.3.?文檔化函數
- 2.4.?萬物皆對象
- 2.5.?代碼縮進
- 2.6.?測試模塊
- 第?3?章?內置數據類型
- 3.1.?Dictionary 介紹
- 3.2.?List 介紹
- 3.3.?Tuple 介紹
- 3.4.?變量聲明
- 3.5.?格式化字符串
- 3.6.?映射 list
- 3.7.?連接 list 與分割字符串
- 3.8.?小結
- 第?4?章?自省的威力
- 4.1.?概覽
- 4.2.?使用可選參數和命名參數
- 4.3.?使用 type、str、dir 和其它內置函數
- 4.4.?通過 getattr 獲取對象引用
- 4.5.?過濾列表
- 4.6.?and 和 or 的特殊性質
- 4.7.?使用 lambda 函數
- 4.8.?全部放在一起
- 4.9.?小結
- 第?5?章?對象和面向對象
- 5.1.?概覽
- 5.2.?使用 from _module_ import 導入模塊
- 5.3.?類的定義
- 5.4.?類的實例化
- 5.5.?探索 UserDict:一個封裝類
- 5.6.?專用類方法
- 5.7.?高級專用類方法
- 5.8.?類屬性介紹
- 5.9.?私有函數
- 5.10.?小結
- 第?6?章?異常和文件處理
- 6.1.?異常處理
- 6.2.?與文件對象共事
- 6.3.?for 循環
- 6.4.?使用 `sys.modules`
- 6.5.?與目錄共事
- 6.6.?全部放在一起
- 6.7.?小結
- 第?7?章?正則表達式
- 7.1.?概覽
- 7.2.?個案研究:街道地址
- 7.3.?個案研究:羅馬字母
- 7.4.?使用 {n,m} 語法
- 7.5.?松散正則表達式
- 7.6.?個案研究:解析電話號碼
- 7.7.?小結
- 第?8?章?HTML 處理
- 8.1.?概覽
- 8.2.?sgmllib.py 介紹
- 8.3.?從 HTML 文檔中提取數據
- 8.4.?BaseHTMLProcessor.py 介紹
- 8.5.?locals 和 globals
- 8.6.?基于 dictionary 的字符串格式化
- 8.7.?給屬性值加引號
- 8.8.?dialect.py 介紹
- 8.9.?全部放在一起
- 8.10.?小結
- 第?9?章?XML 處理
- 9.1.?概覽
- 9.2.?包
- 9.3.?XML 解析
- 9.4.?Unicode
- 9.5.?搜索元素
- 9.6.?訪問元素屬性
- 9.7.?Segue [9]
- 第?10?章?腳本和流
- 10.1.?抽象輸入源
- 10.2.?標準輸入、輸出和錯誤
- 10.3.?查詢緩沖節點
- 10.4.?查找節點的直接子節點
- 10.5.?根據節點類型創建不同的處理器
- 10.6.?處理命令行參數
- 10.7.?全部放在一起
- 10.8.?小結
- 第?11?章?HTTP Web 服務
- 11.1.?概覽
- 11.2.?避免通過 HTTP 重復地獲取數據
- 11.3.?HTTP 的特性
- 11.4.?調試 HTTP web 服務
- 11.5.?設置 User-Agent
- 11.6.?處理 Last-Modified 和 ETag
- 11.7.?處理重定向
- 11.8.?處理壓縮數據
- 11.9.?全部放在一起
- 11.10.?小結
- 第?12?章?SOAP Web 服務
- 12.1.?概覽
- 12.2.?安裝 SOAP 庫
- 12.3.?步入 SOAP
- 12.4.? SOAP 網絡服務查錯
- 12.5.?WSDL 介紹
- 12.6.?以 WSDL 進行 SOAP 內省
- 12.7.?搜索 Google
- 12.8.? SOAP 網絡服務故障排除
- 12.9.?小結
- 第?13?章?單元測試
- 13.1.?羅馬數字程序介紹 II
- 13.2.?深入
- 13.3.?romantest.py 介紹
- 13.4.?正面測試 (Testing for success)
- 13.5.?負面測試 (Testing for failure)
- 13.6.?完備性檢測 (Testing for sanity)
- 第?14?章?測試優先編程
- 14.1.?roman.py, 第 1 階段
- 14.2.?roman.py, 第 2 階段
- 14.3.?roman.py, 第 3 階段
- 14.4.?roman.py, 第 4 階段
- 14.5.?roman.py, 第 5 階段
- 第?15?章?重構
- 15.1.?處理 bugs
- 15.2.?應對需求變化
- 15.3.?重構
- 15.4.?后記
- 15.5.?小結
- 第?16?章?函數編程
- 16.1.?概覽
- 16.2.?找到路徑
- 16.3.?重識列表過濾
- 16.4.?重識列表映射
- 16.5.?數據中心思想編程
- 16.6.?動態導入模塊
- 16.7.?全部放在一起
- 16.8.?小結
- 第?17?章?動態函數
- 17.1.?概覽
- 17.2.?plural.py, 第 1 階段
- 17.3.?plural.py, 第 2 階段
- 17.4.?plural.py, 第 3 階段
- 17.5.?plural.py, 第 4 階段
- 17.6.?plural.py, 第 5 階段
- 17.7.?plural.py, 第 6 階段
- 17.8.?小結
- 第?18?章?性能優化
- 18.1.?概覽
- 18.2.?使用 timeit 模塊
- 18.3.?優化正則表達式
- 18.4.?優化字典查找
- 18.5.?優化列表操作
- 18.6.?優化字符串操作
- 18.7.?小結
- 附錄?A.?進一步閱讀
- 附錄?B.?五分鐘回顧
- 附錄?C.?技巧和竅門
- 附錄?D.?示例清單
- 附錄?E.?修訂歷史
- 附錄?F.?關于本書
- 附錄 G. GNU Free Documentation License
- G.0. Preamble
- G.1.?Applicability and definitions
- G.2.?Verbatim copying
- G.3.?Copying in quantity
- G.4.?Modifications
- G.5.?Combining documents
- G.6.?Collections of documents
- G.7.?Aggregation with independent works
- G.8.?Translation
- G.9.?Termination
- G.10.?Future revisions of this license
- G.11.?How to use this License for your documents
- 附錄 H. GNU 自由文檔協議
- H.0. 序
- H.1.?適用范圍和定義
- H.2.?原樣復制
- H.3.?大量復制
- H.4.?修改
- H.5.?合并文檔
- H.6.?文檔合集
- H.7.?獨立著作聚集
- H.8.?翻譯
- H.9.?終止協議
- H.10.?協議將來的修訂
- H.11.?如何為你的文檔使用本協議
- 附錄 I. Python license
- I.A. History of the software
- I.B.?Terms and conditions for accessing or otherwise using Python
- 附錄 J. Python 協議
- J.0. 關于譯文的聲明
- J.A.?軟件的歷史
- J.B.?使用 Python 的條款和條件