# 17.7.?`plural.py`, 第 6 階段
現在你已準備好探討生成器 (Generator) 了。
## 例?17.17.?`plural6.py`
```
import re
def rules(language):
for line in file('rules.%s' % language):
pattern, search, replace = line.split()
yield lambda word: re.search(pattern, word) and re.sub(search, replace, word)
def plural(noun, language='en'):
for applyRule in rules(language):
result = applyRule(noun)
if result: return result
```
這里使用了被稱作生成器的技術,我不打算在你看過一個簡單例子之前試圖解釋它。
## 例?17.18.?介紹生成器
```
>>> def make_counter(x):
... print 'entering make_counter'
... while 1:
... yield x
... print 'incrementing x'
... x = x + 1
...
>>> counter = make_counter(2)
>>> counter
<generator object at 0x001C9C10>
>>> counter.next()
entering make_counter
2
>>> counter.next()
incrementing x
3
>>> counter.next()
incrementing x
4
```
| | |
| --- | --- |
| \[1\] | `make_counter` 中出現關鍵字 `yield` 意味著這不是一個普通的函數。它是一種每次生成一個值的特殊函數。你可以把它看成是一個可恢復函數。調用它會返回一個生成器,它可以返回 `x` 的連續值。 |
| \[2\] | 想要創建一個 `make_counter` 生成器的實例,只要像其它函數一樣調用。注意這并沒有真正執行函數代碼。你可以分辨出這一點,因為 `make_counter` 的第一行是 `print` 語句,然而沒有任何內容輸出。 |
| \[3\] | `make_counter` 函數返回一個生成器對象。 |
| \[4\] | 你第一次調用生成器對象的 `next()` 方法,將執行 `make_counter` 中的代碼執行到第一個 `yield` 語句,然后返回生產 (yield) 出來的值。在本例中,這個值是 `2`,因為你是通過 `make_counter(2)` 來創建最初的生成器的。 |
| \[5\] | 不斷調用生成器對象的 `next()` _將從你上次離開的位置重新開始_ 并繼續下去直到你又一次遇到 `yield` 語句。接下來執行 `print` 語句來打印 `incrementing x`,然后執行 `x = x + 1` 語句來真正地增加。然后你進入 `while` 的又一次循環,你所做的第一件事是 `yield x`,返回目前的 `x` 值 (現在是3)。 |
| \[6\] | 第二次你調用 `counter.next()` 時,你又做一遍相同的事情,但是這次 `x` 是 `4`。如此繼續。因為 `make_counter` 設置的是一個無限循環,理論上你可以永遠這樣繼續下去,不斷地遞增并彈出 `x` 值。現在讓我們看看生成器更具意義的應用。 |
## 例?17.19.?使用生成器替代遞歸
```
def fibonacci(max):
a, b = 0, 1
while a < max:
yield a
a, b = b, a+b
```
| | |
| --- | --- |
| \[1\] | 斐波納契數列 (Fibonacci sequence) 是每個數都是前面兩個數值和的一個數列。它從 `0` 和 `1` 開始,開始增長得很慢,但越來越快。開始這個數列你需要兩個變量:`a` 從 `0`開始,`b` 從 `1` 開始。 |
| \[2\] | `a` 是數列的當前值,彈出它。 |
| \[3\] | `b` 是數列的下一個數,把它賦值給 `a`,同時計算出 (`a+b`) 并賦值給 `b` 放在一邊稍后使用。注意這是并行發生的,如果 `a` 是 `3`,`b` 是 `5`,那么 `a, b = b, a+b` 將會設置 `a` 為 `5` (`b` 的原值),`b` 為 `8` (`a` 和 `b` 之和)。 |
這樣你就有了生成連續的 Fibonacci 數的函數了。當然你也可以通過遞歸做到,但是這里的方法更加易讀。并且也與 `for` 工作得很好。
## 例?17.20.?`for` 循環中的生成器
```
>>> for n in fibonacci(1000):
... print n,
0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987
```
| | |
| --- | --- |
| \[1\] | 你可以在 `for` 循環中直接使用 `fibonacci` 這樣的生成器。`for` 循環將會創建一個生成器對象并連續調用其 `next()` 方法獲得值并賦予 `for` 循環變量 (`n`)。 |
| \[2\] | 每輪 `for` 循環 `n` 都從 `fibonacci` 的 `yield` 語句獲得一個新的值。當 `fibonacci` 超出數字限定 (`a` 超過 `max`,你在這里限定的是 `1000`) 很自然地退出 `for` 循環。 |
好了,讓我們回到 `plural` 函數看看如何可以把它用起來。
## 例?17.21.?生成器生成動態函數
```
def rules(language):
for line in file('rules.%s' % language):
pattern, search, replace = line.split()
yield lambda word: re.search(pattern, word) and re.sub(search, replace, word)
def plural(noun, language='en'):
for applyRule in rules(language):
result = applyRule(noun)
if result: return result
```
| | |
| --- | --- |
| \[1\] | `for line in file(...)` 是從文件中一行行讀取的通用方法,每次一行。它能正常工作是因為 _`file` 實際上返回一個生成器_,它的 `next()` 方法返回文件中的下一行。簡直太酷了,光是想想就讓我滿頭大汗。 |
| \[2\] | 這沒有什么神奇之處。還記得規則文件的每一行都用空白分開三個值嗎?所以 `line.split()` 返回一個三元素元組,你把這些值賦給了 3 個局部變量。 |
| \[3\] | _然后你不斷地彈出。_ 你彈出什么呢?一個使用 `lambda` 動態生成的函數,而這個函數實際上是一個閉合 (把本地變量 `pattern`,`search` 和 `replace` 作為常量)。換句話說,`rules` 是一個彈出規則函數的生成器。 |
| \[4\] | 既然 `rules` 是一個生成器,你就可以在 `for` 循環中直接使用它。`for` 循環的第一輪你調用 `rules` 函數,打開規則文件,讀取第一行,動態構建一個根據規則文件第一行匹配并應用規則的函數。`for` 循環的第二輪將會從上一輪 `rules` 中停下的位置 (`for line in file(...)` 循環內部) 讀取規則文件的第二行,動態構建根據規則文件第二行匹配并應用規則的另一個函數。如此繼續下去。 |
你在[第 5 階段](stage5.html "17.6.?plural.py, 第 5 階段")得到的是什么?第 5 階段中,你讀取整個規則文件并在使用第一條規則之前構建一個所有規則組成的列表。現在有了生成器,你可以更舒適地做到這一切:你打開并讀取第一條規則,根據它創建函數并使用之,如果它適用則根本不去讀取規則文件剩下的內容,也不去建立另外的函數。
## 進一步閱讀
* PEP 255 定義生成器。
* Python Cookbook 有[生成器的例子](http://www.google.com/search?q=generators+cookbook+site:aspn.activestate.com)。
- 版權信息
- 第?1?章?安裝 Python
- 1.1.?哪一種 Python 適合您?
- 1.2.?Windows 上的 Python
- 1.3.?Mac OS X 上的 Python
- 1.4.?Mac OS 9 上的 Python
- 1.5.?RedHat Linux 上的 Python
- 1.6.?Debian GNU/Linux 上的 Python
- 1.7.?從源代碼安裝 Python
- 1.8.?使用 Python 的交互 Shell
- 1.9.?小結
- 第?2?章?第一個 Python 程序
- 2.1.?概覽
- 2.2.?函數聲明
- 2.3.?文檔化函數
- 2.4.?萬物皆對象
- 2.5.?代碼縮進
- 2.6.?測試模塊
- 第?3?章?內置數據類型
- 3.1.?Dictionary 介紹
- 3.2.?List 介紹
- 3.3.?Tuple 介紹
- 3.4.?變量聲明
- 3.5.?格式化字符串
- 3.6.?映射 list
- 3.7.?連接 list 與分割字符串
- 3.8.?小結
- 第?4?章?自省的威力
- 4.1.?概覽
- 4.2.?使用可選參數和命名參數
- 4.3.?使用 type、str、dir 和其它內置函數
- 4.4.?通過 getattr 獲取對象引用
- 4.5.?過濾列表
- 4.6.?and 和 or 的特殊性質
- 4.7.?使用 lambda 函數
- 4.8.?全部放在一起
- 4.9.?小結
- 第?5?章?對象和面向對象
- 5.1.?概覽
- 5.2.?使用 from _module_ import 導入模塊
- 5.3.?類的定義
- 5.4.?類的實例化
- 5.5.?探索 UserDict:一個封裝類
- 5.6.?專用類方法
- 5.7.?高級專用類方法
- 5.8.?類屬性介紹
- 5.9.?私有函數
- 5.10.?小結
- 第?6?章?異常和文件處理
- 6.1.?異常處理
- 6.2.?與文件對象共事
- 6.3.?for 循環
- 6.4.?使用 `sys.modules`
- 6.5.?與目錄共事
- 6.6.?全部放在一起
- 6.7.?小結
- 第?7?章?正則表達式
- 7.1.?概覽
- 7.2.?個案研究:街道地址
- 7.3.?個案研究:羅馬字母
- 7.4.?使用 {n,m} 語法
- 7.5.?松散正則表達式
- 7.6.?個案研究:解析電話號碼
- 7.7.?小結
- 第?8?章?HTML 處理
- 8.1.?概覽
- 8.2.?sgmllib.py 介紹
- 8.3.?從 HTML 文檔中提取數據
- 8.4.?BaseHTMLProcessor.py 介紹
- 8.5.?locals 和 globals
- 8.6.?基于 dictionary 的字符串格式化
- 8.7.?給屬性值加引號
- 8.8.?dialect.py 介紹
- 8.9.?全部放在一起
- 8.10.?小結
- 第?9?章?XML 處理
- 9.1.?概覽
- 9.2.?包
- 9.3.?XML 解析
- 9.4.?Unicode
- 9.5.?搜索元素
- 9.6.?訪問元素屬性
- 9.7.?Segue [9]
- 第?10?章?腳本和流
- 10.1.?抽象輸入源
- 10.2.?標準輸入、輸出和錯誤
- 10.3.?查詢緩沖節點
- 10.4.?查找節點的直接子節點
- 10.5.?根據節點類型創建不同的處理器
- 10.6.?處理命令行參數
- 10.7.?全部放在一起
- 10.8.?小結
- 第?11?章?HTTP Web 服務
- 11.1.?概覽
- 11.2.?避免通過 HTTP 重復地獲取數據
- 11.3.?HTTP 的特性
- 11.4.?調試 HTTP web 服務
- 11.5.?設置 User-Agent
- 11.6.?處理 Last-Modified 和 ETag
- 11.7.?處理重定向
- 11.8.?處理壓縮數據
- 11.9.?全部放在一起
- 11.10.?小結
- 第?12?章?SOAP Web 服務
- 12.1.?概覽
- 12.2.?安裝 SOAP 庫
- 12.3.?步入 SOAP
- 12.4.? SOAP 網絡服務查錯
- 12.5.?WSDL 介紹
- 12.6.?以 WSDL 進行 SOAP 內省
- 12.7.?搜索 Google
- 12.8.? SOAP 網絡服務故障排除
- 12.9.?小結
- 第?13?章?單元測試
- 13.1.?羅馬數字程序介紹 II
- 13.2.?深入
- 13.3.?romantest.py 介紹
- 13.4.?正面測試 (Testing for success)
- 13.5.?負面測試 (Testing for failure)
- 13.6.?完備性檢測 (Testing for sanity)
- 第?14?章?測試優先編程
- 14.1.?roman.py, 第 1 階段
- 14.2.?roman.py, 第 2 階段
- 14.3.?roman.py, 第 3 階段
- 14.4.?roman.py, 第 4 階段
- 14.5.?roman.py, 第 5 階段
- 第?15?章?重構
- 15.1.?處理 bugs
- 15.2.?應對需求變化
- 15.3.?重構
- 15.4.?后記
- 15.5.?小結
- 第?16?章?函數編程
- 16.1.?概覽
- 16.2.?找到路徑
- 16.3.?重識列表過濾
- 16.4.?重識列表映射
- 16.5.?數據中心思想編程
- 16.6.?動態導入模塊
- 16.7.?全部放在一起
- 16.8.?小結
- 第?17?章?動態函數
- 17.1.?概覽
- 17.2.?plural.py, 第 1 階段
- 17.3.?plural.py, 第 2 階段
- 17.4.?plural.py, 第 3 階段
- 17.5.?plural.py, 第 4 階段
- 17.6.?plural.py, 第 5 階段
- 17.7.?plural.py, 第 6 階段
- 17.8.?小結
- 第?18?章?性能優化
- 18.1.?概覽
- 18.2.?使用 timeit 模塊
- 18.3.?優化正則表達式
- 18.4.?優化字典查找
- 18.5.?優化列表操作
- 18.6.?優化字符串操作
- 18.7.?小結
- 附錄?A.?進一步閱讀
- 附錄?B.?五分鐘回顧
- 附錄?C.?技巧和竅門
- 附錄?D.?示例清單
- 附錄?E.?修訂歷史
- 附錄?F.?關于本書
- 附錄 G. GNU Free Documentation License
- G.0. Preamble
- G.1.?Applicability and definitions
- G.2.?Verbatim copying
- G.3.?Copying in quantity
- G.4.?Modifications
- G.5.?Combining documents
- G.6.?Collections of documents
- G.7.?Aggregation with independent works
- G.8.?Translation
- G.9.?Termination
- G.10.?Future revisions of this license
- G.11.?How to use this License for your documents
- 附錄 H. GNU 自由文檔協議
- H.0. 序
- H.1.?適用范圍和定義
- H.2.?原樣復制
- H.3.?大量復制
- H.4.?修改
- H.5.?合并文檔
- H.6.?文檔合集
- H.7.?獨立著作聚集
- H.8.?翻譯
- H.9.?終止協議
- H.10.?協議將來的修訂
- H.11.?如何為你的文檔使用本協議
- 附錄 I. Python license
- I.A. History of the software
- I.B.?Terms and conditions for accessing or otherwise using Python
- 附錄 J. Python 協議
- J.0. 關于譯文的聲明
- J.A.?軟件的歷史
- J.B.?使用 Python 的條款和條件