# 10.6.?處理命令行參數
Python 完全支持創建在命令行運行的程序,也支持通過命令行參數和短長樣式來指定各種選項。這些并非是 XML 特定的,但是這樣的腳本可以充分使用命令行處理,看來是時候提一下它了。
如果不理解命令行參數如何暴露給你的 Python 程序,討論命令行處理是很困難的,所以讓我們先寫個簡單點的程序來看一下。
## 例?10.20.?`sys.argv` 介紹
如果您還沒有下載本書附帶的樣例程序, 可以 [下載本程序和其他樣例程序](http://www.woodpecker.org.cn/diveintopython/download/diveintopython-exampleszh-cn-5.4b.zip "Download example scripts")。
```
#argecho.py
import sys
for arg in sys.argv:
print arg
```
| | |
| --- | --- |
| \[1\] | 每個傳遞給程序的命令行參數都在 `sys.argv` 中,而它僅僅是一個列表。這里我們在獨立行中打印出每個參數。 |
## 例?10.21.?`sys.argv` 的內容
```
[you@localhost py]$ python argecho.py
argecho.py
[you@localhost py]$ python argecho.py abc def
argecho.py
abc
def
[you@localhost py]$ python argecho.py --help
argecho.py
--help
[you@localhost py]$ python argecho.py -m kant.xml
argecho.py
-m
kant.xml
```
| | |
| --- | --- |
| \[1\] | 關于 `sys.argv` 需要了解的第一件事情就是:它包含了你正在調用的腳本的名稱。你后面會實際使用這個知識,在[第?16?章 _函數編程_](../functional_programming/index.html "第?16?章?函數編程")中。現在不用擔心。 |
| \[2\] | 命令行參數通過空格進行分隔。在 `sys.argv` 列表中,每個參數都是一個獨立的元素。 |
| \[3\] | 命令行標志,像 `--help`,在 `sys.argv` 列表中還保存了它們自己的元素。 |
| \[4\] | 為了讓事情更有趣,有些命令行標志本身就接收參數。比如,這里有一個標記 (`-m`) 接收一個參數 (`kant.xml`)。標記自身和標記參數只是 `sys.argv` 列表中的一串元素。并沒有試圖將元素與其它元素進行關聯;所有你得到的是一個列表。 |
所以正如你所看到的,你確實擁有了命令行傳入的所有信息,但是接下來要實際使用它似乎不那么容易。對于只是接收單個參數或者沒有標記的簡單程序,你可以簡單地使用 `sys.argv[1]` 來訪問參數。這沒有什么羞恥的;我一直都是這樣做的。對更復雜的程序,你需要 `getopt` 模塊。
## 例?10.22.?`getopt` 介紹
```
def main(argv):
grammar = "kant.xml"
try:
opts, args = getopt.getopt(argv, "hg:d", ["help", "grammar="])
except getopt.GetoptError:
usage()
sys.exit(2)
...
if __name__ == "__main__":
main(sys.argv[1:])
```
| | |
| --- | --- |
| \[1\] | 首先,看一下例子的最后并注意你正在調用 `main` 函數,參數是 `sys.argv[1:]`。記住,`sys.argv[0]` 是你正在運行腳本的名稱;在處理命令行時,你不用關心它,所以你可以砍掉它并傳入列表的剩余部分。 |
| \[2\] | 這里就是所有有趣處理發生的地方。`getopt` 模塊的 `getopt` 函數接受三個參數:參數列表 (你從 `sys.argv[1:]` 得到的)、一個包含了程序所有可能接收到的單字符命令行標志,和一個等價于單字符的長命令行標志的列表。第一次看的時候,這有點混亂,下面有更多的細節解釋。 |
| \[3\] | 在解析這些命令行標志時,如果有任何事情錯了,`getopt` 會拋出異常,你可以捕獲它。你可以告訴 `getopt` 你明白的所有標志,那么這也意味著終端用戶可以傳入一些你不理解的命令行標志。 |
| \[4\] | 和 UNIX 世界中的標準實踐一樣,如果腳本被傳入了不能理解的標志,你要打印出正確用法的一個概要并友好地退出。注意,在這里我沒有寫出 `usage` 函數。你還是要在某個地方寫一個,使它打印出合適的概要;它不是自動的。 |
那么你傳給 `getopt` 函數的參數是什么呢?好的,第一個只不過是一個命令行標志和參數的原始列表 (不包括第一個元素――腳本名稱,你在調用 `main` 函數之前就已經將它砍掉了)。第二個是腳本接收的短命令行標志的一個列表。
## `"hg:d"`
`-h`
打印用法概要
`-g ...`
使用給定的語法文件或 URL
`-d`
在解析時顯示調試信息
第一個標志和第三個標志是簡單的獨立標志;你選擇是否指定它們,它們做某些事情 (打印幫助) 或者改變狀態 (打開調試)。但是,第二個標志 (`-g`) _必須_ 跟隨一個參數――進行讀取的語法文件的名稱。實際上,它可以是一個文件名或者一個 web 地址,這時還不知道 (后面會確定),但是你要知道必須要_有些東西_。所以,你可以通過在 `getopt` 函數的第二個參數的 `g` 后面放一個冒號,來向 `getopt` 說明這一點。
更復雜的是,這個腳本既接收短標志 (像 `-h`),也接受長標志 (像 `--help`),并且你要它們做相同的事。這就是 `getopt` 第三個參數存在的原因:它是指定長標志的一個列表,其中的長標志是和第二個參數中指定的短標志相對應的。
## `["help", "grammar="]`
`--help`
打印用法概要
`--grammar ...`
使用給定的語法文件或 URL
這里有三點要注意:
1. 所有命令行中的長標志以兩個短劃線開始,但是在調用 `getopt` 時,你不用包含這兩個短劃線。它們是能夠被理解的。
2. `--grammar` 標志的后面必須跟著另一個參數,就像 `-g` 標志一樣。通過等于號標識出來:`"grammar="`。
3. 長標志列表比短標志列表更短一些,因為 `-d` 標志沒有相應的長標志。這很好;只有 `-d` 才會打開調試。但是短標志和長標志的順序必須是相同的,你應該先指定有長標志的短標志,然后才是剩下的短標志。
被搞昏沒?讓我們看一下真實的代碼,看看它在上下文中是否起作用。
## 例?10.23.?在 `kgp.py` 中處理命令行參數
```
def main(argv):
grammar = "kant.xml"
try:
opts, args = getopt.getopt(argv, "hg:d", ["help", "grammar="])
except getopt.GetoptError:
usage()
sys.exit(2)
for opt, arg in opts:
if opt in ("-h", "--help"):
usage()
sys.exit()
elif opt == '-d':
global _debug
_debug = 1
elif opt in ("-g", "--grammar"):
grammar = arg
source = "".join(args)
k = KantGenerator(grammar, source)
print k.output()
```
| | |
| --- | --- |
| \[1\] | `grammar` 變量會跟蹤你正在使用的語法文件。如果你沒有在命令行指定它 (使用 `-g` 或者 `--grammar` 標志定義它),在這里你將初始化它。 |
| \[2\] | 你從 `getopt` 取回的 `opts` 變量是一個由元組 (`flag` 和 `argument`) 組成的列表。如果標志沒有帶任何參數,那么 `arg` 只是 `None`。這使得遍歷標志更容易了。 |
| \[3\] | `getopt` 驗證命令行標志是否可接受,但是它不會在短標志和長標志之間做任何轉換。如果你指定 `-h` 標志,`opt` 將會包含 `"-h"`;如果你指定 `--help` 標志,`opt` 將會包含`"--help"` 標志。所以你需要檢查它們兩個。 |
| \[4\] | 別忘了,`-d` 標志沒有相應的長標志,所以你只需要檢查短形式。如果你找到了它,你就可以設置一個全局變量來指示后面要打印出調試信息。(我習慣在腳本的開發過程中使用它。什么,你以為所有這些程序都是一次成功的?) |
| \[5\] | 如果你找到了一個語法文件,跟在 `-g` 或者 `--grammar` 標志后面,那你就要把跟在后面的參數 (`arg`) 保存到變量`grammar` 中,覆蓋掉在 `main` 函數你初始化的默認值。 |
| \[6\] | 就是這樣。你已經遍歷并處理了所有的命令行標志。這意味著所有剩下的東西都必須是命令行參數。它們由 `getopt` 函數的 `args` 變量返回。在這個例子中,你把它們當作了解析器源材料。如果沒有指定命令行參數,`args` 將是一個空列表,而 `source` 將是空字符串。 |
- 版權信息
- 第?1?章?安裝 Python
- 1.1.?哪一種 Python 適合您?
- 1.2.?Windows 上的 Python
- 1.3.?Mac OS X 上的 Python
- 1.4.?Mac OS 9 上的 Python
- 1.5.?RedHat Linux 上的 Python
- 1.6.?Debian GNU/Linux 上的 Python
- 1.7.?從源代碼安裝 Python
- 1.8.?使用 Python 的交互 Shell
- 1.9.?小結
- 第?2?章?第一個 Python 程序
- 2.1.?概覽
- 2.2.?函數聲明
- 2.3.?文檔化函數
- 2.4.?萬物皆對象
- 2.5.?代碼縮進
- 2.6.?測試模塊
- 第?3?章?內置數據類型
- 3.1.?Dictionary 介紹
- 3.2.?List 介紹
- 3.3.?Tuple 介紹
- 3.4.?變量聲明
- 3.5.?格式化字符串
- 3.6.?映射 list
- 3.7.?連接 list 與分割字符串
- 3.8.?小結
- 第?4?章?自省的威力
- 4.1.?概覽
- 4.2.?使用可選參數和命名參數
- 4.3.?使用 type、str、dir 和其它內置函數
- 4.4.?通過 getattr 獲取對象引用
- 4.5.?過濾列表
- 4.6.?and 和 or 的特殊性質
- 4.7.?使用 lambda 函數
- 4.8.?全部放在一起
- 4.9.?小結
- 第?5?章?對象和面向對象
- 5.1.?概覽
- 5.2.?使用 from _module_ import 導入模塊
- 5.3.?類的定義
- 5.4.?類的實例化
- 5.5.?探索 UserDict:一個封裝類
- 5.6.?專用類方法
- 5.7.?高級專用類方法
- 5.8.?類屬性介紹
- 5.9.?私有函數
- 5.10.?小結
- 第?6?章?異常和文件處理
- 6.1.?異常處理
- 6.2.?與文件對象共事
- 6.3.?for 循環
- 6.4.?使用 `sys.modules`
- 6.5.?與目錄共事
- 6.6.?全部放在一起
- 6.7.?小結
- 第?7?章?正則表達式
- 7.1.?概覽
- 7.2.?個案研究:街道地址
- 7.3.?個案研究:羅馬字母
- 7.4.?使用 {n,m} 語法
- 7.5.?松散正則表達式
- 7.6.?個案研究:解析電話號碼
- 7.7.?小結
- 第?8?章?HTML 處理
- 8.1.?概覽
- 8.2.?sgmllib.py 介紹
- 8.3.?從 HTML 文檔中提取數據
- 8.4.?BaseHTMLProcessor.py 介紹
- 8.5.?locals 和 globals
- 8.6.?基于 dictionary 的字符串格式化
- 8.7.?給屬性值加引號
- 8.8.?dialect.py 介紹
- 8.9.?全部放在一起
- 8.10.?小結
- 第?9?章?XML 處理
- 9.1.?概覽
- 9.2.?包
- 9.3.?XML 解析
- 9.4.?Unicode
- 9.5.?搜索元素
- 9.6.?訪問元素屬性
- 9.7.?Segue [9]
- 第?10?章?腳本和流
- 10.1.?抽象輸入源
- 10.2.?標準輸入、輸出和錯誤
- 10.3.?查詢緩沖節點
- 10.4.?查找節點的直接子節點
- 10.5.?根據節點類型創建不同的處理器
- 10.6.?處理命令行參數
- 10.7.?全部放在一起
- 10.8.?小結
- 第?11?章?HTTP Web 服務
- 11.1.?概覽
- 11.2.?避免通過 HTTP 重復地獲取數據
- 11.3.?HTTP 的特性
- 11.4.?調試 HTTP web 服務
- 11.5.?設置 User-Agent
- 11.6.?處理 Last-Modified 和 ETag
- 11.7.?處理重定向
- 11.8.?處理壓縮數據
- 11.9.?全部放在一起
- 11.10.?小結
- 第?12?章?SOAP Web 服務
- 12.1.?概覽
- 12.2.?安裝 SOAP 庫
- 12.3.?步入 SOAP
- 12.4.? SOAP 網絡服務查錯
- 12.5.?WSDL 介紹
- 12.6.?以 WSDL 進行 SOAP 內省
- 12.7.?搜索 Google
- 12.8.? SOAP 網絡服務故障排除
- 12.9.?小結
- 第?13?章?單元測試
- 13.1.?羅馬數字程序介紹 II
- 13.2.?深入
- 13.3.?romantest.py 介紹
- 13.4.?正面測試 (Testing for success)
- 13.5.?負面測試 (Testing for failure)
- 13.6.?完備性檢測 (Testing for sanity)
- 第?14?章?測試優先編程
- 14.1.?roman.py, 第 1 階段
- 14.2.?roman.py, 第 2 階段
- 14.3.?roman.py, 第 3 階段
- 14.4.?roman.py, 第 4 階段
- 14.5.?roman.py, 第 5 階段
- 第?15?章?重構
- 15.1.?處理 bugs
- 15.2.?應對需求變化
- 15.3.?重構
- 15.4.?后記
- 15.5.?小結
- 第?16?章?函數編程
- 16.1.?概覽
- 16.2.?找到路徑
- 16.3.?重識列表過濾
- 16.4.?重識列表映射
- 16.5.?數據中心思想編程
- 16.6.?動態導入模塊
- 16.7.?全部放在一起
- 16.8.?小結
- 第?17?章?動態函數
- 17.1.?概覽
- 17.2.?plural.py, 第 1 階段
- 17.3.?plural.py, 第 2 階段
- 17.4.?plural.py, 第 3 階段
- 17.5.?plural.py, 第 4 階段
- 17.6.?plural.py, 第 5 階段
- 17.7.?plural.py, 第 6 階段
- 17.8.?小結
- 第?18?章?性能優化
- 18.1.?概覽
- 18.2.?使用 timeit 模塊
- 18.3.?優化正則表達式
- 18.4.?優化字典查找
- 18.5.?優化列表操作
- 18.6.?優化字符串操作
- 18.7.?小結
- 附錄?A.?進一步閱讀
- 附錄?B.?五分鐘回顧
- 附錄?C.?技巧和竅門
- 附錄?D.?示例清單
- 附錄?E.?修訂歷史
- 附錄?F.?關于本書
- 附錄 G. GNU Free Documentation License
- G.0. Preamble
- G.1.?Applicability and definitions
- G.2.?Verbatim copying
- G.3.?Copying in quantity
- G.4.?Modifications
- G.5.?Combining documents
- G.6.?Collections of documents
- G.7.?Aggregation with independent works
- G.8.?Translation
- G.9.?Termination
- G.10.?Future revisions of this license
- G.11.?How to use this License for your documents
- 附錄 H. GNU 自由文檔協議
- H.0. 序
- H.1.?適用范圍和定義
- H.2.?原樣復制
- H.3.?大量復制
- H.4.?修改
- H.5.?合并文檔
- H.6.?文檔合集
- H.7.?獨立著作聚集
- H.8.?翻譯
- H.9.?終止協議
- H.10.?協議將來的修訂
- H.11.?如何為你的文檔使用本協議
- 附錄 I. Python license
- I.A. History of the software
- I.B.?Terms and conditions for accessing or otherwise using Python
- 附錄 J. Python 協議
- J.0. 關于譯文的聲明
- J.A.?軟件的歷史
- J.B.?使用 Python 的條款和條件