# 9.2.?包
實際上解析一個 XML 文檔是很簡單的:只要一行代碼。但是,在你接觸那行代碼前,需要暫時岔開一下,討論一下包。
## 例?9.5.?載入一個 XML 文檔 (偷瞥一下)
```
>>> from xml.dom import minidom
>>> xmldoc = minidom.parse('~/diveintopython/common/py/kgp/binary.xml')
```
| | |
| --- | --- |
| \[1\] | 這個語法你之前沒有見過。它看上去很像我們熟知的 `from _module_ import`,但是`"."` 使得它好像不只是普通的 import 那么簡單。事實上,`xml` 稱為包,`dom` 是 `xml` 中嵌套的包,而 `minidom` 是 `xml.dom` 中的模塊。 |
聽起來挺復雜的,其實不是。看一下確切的實現可能會有幫助。包不過是模塊的目錄;嵌套包是子目錄。一個包 (或一個嵌套包) 中的模塊也只是 `.py` 文件罷了,永遠都是,只是它們是在一個子目錄中,而不是在你的 Python 安裝環境的主 `lib/` 目錄下。
## 例?9.6.?包的文件布局
```
Python21/ Python 安裝根目錄 (可執行文件的所在地)
|
+--lib/ 庫目錄 (標準庫模塊的所在地)
|
+-- xml/ xml包 (實際上目錄中還有其它東西)
|
+--sax/ xml.sax包 (也只是一個目錄)
|
+--dom/ xml.dom包 (包含 minidom.py)
|
+--parsers/ xml.parsers包 (內部使用)
```
所以你說 `from xml.dom import minidom`,Python 認為它的意思是“在 `xml` 目錄中查找 `dom` 目錄,然后在_這個目錄_ 中查找 `minidom` 模塊,接著導入它并以 `minidom` 命名 ”。但是 Python 更聰明;你不僅可以導入包含在一個包中的所有模塊,還可以從包的模塊中有選擇地導入指定的類或者函數。語法都是一樣的; Python 會根據包的布局理解你的意思,然后自動進行正確的導入。
## 例?9.7.?包也是模塊
```
>>> from xml.dom import minidom
>>> minidom
<module 'xml.dom.minidom' from 'C:\Python21\lib\xml\dom\minidom.pyc'>
>>> minidom.Element
<class xml.dom.minidom.Element at 01095744>
>>> from xml.dom.minidom import Element
>>> Element
<class xml.dom.minidom.Element at 01095744>
>>> minidom.Element
<class xml.dom.minidom.Element at 01095744>
>>> from xml import dom
>>> dom
<module 'xml.dom' from 'C:\Python21\lib\xml\dom\__init__.pyc'>
>>> import xml
>>> xml
<module 'xml' from 'C:\Python21\lib\xml\__init__.pyc'>
```
| | |
| --- | --- |
| \[1\] | 這里你正從一個嵌套包 (`xml.dom`)中導入一個模塊 (`minidom`)。結果就是 `minidom` 被導入到了你 (程序) 的[命名空間](../html_processing/locals_and_globals.html "8.5.?locals 和 globals")中了。要引用 `minidom` 模塊中的類 (比如 `Element`),你必須在它們的類名前面加上模塊名。 |
| \[2\] | 這里你正從一個來自嵌套包 (`xml.dom`) 的模塊 (`minidom`) 中導入一個類 (`Element`)。結果就是 `Element` 直接導入到了你 (程序) 的命名空間中。注意,這樣做并不會干擾以前的導入;現在 `Element` 類可以用兩種方式引用了 (但其實是同一個類)。 |
| \[3\] | 這里你正在導入 `dom` 包 (`xml` 的一個嵌套包),并將其作為一個模塊。一個包的任何層次都可以視為一個模塊,一會兒就會看到。它甚至可以擁有自己的屬性和方法,就像你在前面看到過的模塊。 |
| \[4\] | 這里你正在將根層次的 `xml` 包作為一個模塊導入。 |
那么如何才能導入一個包 (它不過是磁盤上的一個目錄) 并使其成為一個模塊 (它總是在磁盤上的一個文件) 呢?答案就是神奇的 `__init__.py` 文件。你明白了吧,包不只是目錄,它們是包含一個特殊文件 `__init__.py` 的目錄。這個文件定義了包的屬性和方法。例如,`xml.dom` 包含了 `Node` 類,它在`xml/dom/__init__.py`中有所定義。當你將一個包作為模塊導入 (比如從 `xml` 導入 `dom`) 的時候,實際上導入了它的 `__init__.py` 文件。
> 注意
> 一個包是一個其中帶有特殊文件 `__init__.py` 的目錄。`__init__.py` 文件定義了包的屬性和方法。其實它可以什么也不定義;可以只是一個空文件,但是必須要存在。如果 `__init__.py` 不存在,這個目錄就僅僅是一個目錄,而不是一個包,它就不能被導入或者包含其它的模塊和嵌套包。
那為什么非得用包呢?嗯,它們提供了在邏輯上將相關模塊歸為一組的方法。不使用其中帶有 `sax` 和 `dom` 的 `xml` 包,作者也可以選擇將所有的 `sax` 功能放入 `xmlsax.py`中,并將所有的 `dom` 功能放入 `xmldom.py`中,或者干脆將所有東西放入單個模塊中。但是這樣可能不實用 (寫到這兒時,XML 包已經超過了 3000 行代碼) 并且很難管理 (獨立的源文件意味著多個人可以同時在不同的地方進行開發)。
如果你發現自己正在用 Python 編寫一個大型的子系統 (或者,很有可能,當你意識到你的小型子系統已經成長為一個大型子系統時),你應該花費些時間設計一個好的包架構。它是 Python 所擅長的事情之一,所以應該好好利用它。
- 版權信息
- 第?1?章?安裝 Python
- 1.1.?哪一種 Python 適合您?
- 1.2.?Windows 上的 Python
- 1.3.?Mac OS X 上的 Python
- 1.4.?Mac OS 9 上的 Python
- 1.5.?RedHat Linux 上的 Python
- 1.6.?Debian GNU/Linux 上的 Python
- 1.7.?從源代碼安裝 Python
- 1.8.?使用 Python 的交互 Shell
- 1.9.?小結
- 第?2?章?第一個 Python 程序
- 2.1.?概覽
- 2.2.?函數聲明
- 2.3.?文檔化函數
- 2.4.?萬物皆對象
- 2.5.?代碼縮進
- 2.6.?測試模塊
- 第?3?章?內置數據類型
- 3.1.?Dictionary 介紹
- 3.2.?List 介紹
- 3.3.?Tuple 介紹
- 3.4.?變量聲明
- 3.5.?格式化字符串
- 3.6.?映射 list
- 3.7.?連接 list 與分割字符串
- 3.8.?小結
- 第?4?章?自省的威力
- 4.1.?概覽
- 4.2.?使用可選參數和命名參數
- 4.3.?使用 type、str、dir 和其它內置函數
- 4.4.?通過 getattr 獲取對象引用
- 4.5.?過濾列表
- 4.6.?and 和 or 的特殊性質
- 4.7.?使用 lambda 函數
- 4.8.?全部放在一起
- 4.9.?小結
- 第?5?章?對象和面向對象
- 5.1.?概覽
- 5.2.?使用 from _module_ import 導入模塊
- 5.3.?類的定義
- 5.4.?類的實例化
- 5.5.?探索 UserDict:一個封裝類
- 5.6.?專用類方法
- 5.7.?高級專用類方法
- 5.8.?類屬性介紹
- 5.9.?私有函數
- 5.10.?小結
- 第?6?章?異常和文件處理
- 6.1.?異常處理
- 6.2.?與文件對象共事
- 6.3.?for 循環
- 6.4.?使用 `sys.modules`
- 6.5.?與目錄共事
- 6.6.?全部放在一起
- 6.7.?小結
- 第?7?章?正則表達式
- 7.1.?概覽
- 7.2.?個案研究:街道地址
- 7.3.?個案研究:羅馬字母
- 7.4.?使用 {n,m} 語法
- 7.5.?松散正則表達式
- 7.6.?個案研究:解析電話號碼
- 7.7.?小結
- 第?8?章?HTML 處理
- 8.1.?概覽
- 8.2.?sgmllib.py 介紹
- 8.3.?從 HTML 文檔中提取數據
- 8.4.?BaseHTMLProcessor.py 介紹
- 8.5.?locals 和 globals
- 8.6.?基于 dictionary 的字符串格式化
- 8.7.?給屬性值加引號
- 8.8.?dialect.py 介紹
- 8.9.?全部放在一起
- 8.10.?小結
- 第?9?章?XML 處理
- 9.1.?概覽
- 9.2.?包
- 9.3.?XML 解析
- 9.4.?Unicode
- 9.5.?搜索元素
- 9.6.?訪問元素屬性
- 9.7.?Segue [9]
- 第?10?章?腳本和流
- 10.1.?抽象輸入源
- 10.2.?標準輸入、輸出和錯誤
- 10.3.?查詢緩沖節點
- 10.4.?查找節點的直接子節點
- 10.5.?根據節點類型創建不同的處理器
- 10.6.?處理命令行參數
- 10.7.?全部放在一起
- 10.8.?小結
- 第?11?章?HTTP Web 服務
- 11.1.?概覽
- 11.2.?避免通過 HTTP 重復地獲取數據
- 11.3.?HTTP 的特性
- 11.4.?調試 HTTP web 服務
- 11.5.?設置 User-Agent
- 11.6.?處理 Last-Modified 和 ETag
- 11.7.?處理重定向
- 11.8.?處理壓縮數據
- 11.9.?全部放在一起
- 11.10.?小結
- 第?12?章?SOAP Web 服務
- 12.1.?概覽
- 12.2.?安裝 SOAP 庫
- 12.3.?步入 SOAP
- 12.4.? SOAP 網絡服務查錯
- 12.5.?WSDL 介紹
- 12.6.?以 WSDL 進行 SOAP 內省
- 12.7.?搜索 Google
- 12.8.? SOAP 網絡服務故障排除
- 12.9.?小結
- 第?13?章?單元測試
- 13.1.?羅馬數字程序介紹 II
- 13.2.?深入
- 13.3.?romantest.py 介紹
- 13.4.?正面測試 (Testing for success)
- 13.5.?負面測試 (Testing for failure)
- 13.6.?完備性檢測 (Testing for sanity)
- 第?14?章?測試優先編程
- 14.1.?roman.py, 第 1 階段
- 14.2.?roman.py, 第 2 階段
- 14.3.?roman.py, 第 3 階段
- 14.4.?roman.py, 第 4 階段
- 14.5.?roman.py, 第 5 階段
- 第?15?章?重構
- 15.1.?處理 bugs
- 15.2.?應對需求變化
- 15.3.?重構
- 15.4.?后記
- 15.5.?小結
- 第?16?章?函數編程
- 16.1.?概覽
- 16.2.?找到路徑
- 16.3.?重識列表過濾
- 16.4.?重識列表映射
- 16.5.?數據中心思想編程
- 16.6.?動態導入模塊
- 16.7.?全部放在一起
- 16.8.?小結
- 第?17?章?動態函數
- 17.1.?概覽
- 17.2.?plural.py, 第 1 階段
- 17.3.?plural.py, 第 2 階段
- 17.4.?plural.py, 第 3 階段
- 17.5.?plural.py, 第 4 階段
- 17.6.?plural.py, 第 5 階段
- 17.7.?plural.py, 第 6 階段
- 17.8.?小結
- 第?18?章?性能優化
- 18.1.?概覽
- 18.2.?使用 timeit 模塊
- 18.3.?優化正則表達式
- 18.4.?優化字典查找
- 18.5.?優化列表操作
- 18.6.?優化字符串操作
- 18.7.?小結
- 附錄?A.?進一步閱讀
- 附錄?B.?五分鐘回顧
- 附錄?C.?技巧和竅門
- 附錄?D.?示例清單
- 附錄?E.?修訂歷史
- 附錄?F.?關于本書
- 附錄 G. GNU Free Documentation License
- G.0. Preamble
- G.1.?Applicability and definitions
- G.2.?Verbatim copying
- G.3.?Copying in quantity
- G.4.?Modifications
- G.5.?Combining documents
- G.6.?Collections of documents
- G.7.?Aggregation with independent works
- G.8.?Translation
- G.9.?Termination
- G.10.?Future revisions of this license
- G.11.?How to use this License for your documents
- 附錄 H. GNU 自由文檔協議
- H.0. 序
- H.1.?適用范圍和定義
- H.2.?原樣復制
- H.3.?大量復制
- H.4.?修改
- H.5.?合并文檔
- H.6.?文檔合集
- H.7.?獨立著作聚集
- H.8.?翻譯
- H.9.?終止協議
- H.10.?協議將來的修訂
- H.11.?如何為你的文檔使用本協議
- 附錄 I. Python license
- I.A. History of the software
- I.B.?Terms and conditions for accessing or otherwise using Python
- 附錄 J. Python 協議
- J.0. 關于譯文的聲明
- J.A.?軟件的歷史
- J.B.?使用 Python 的條款和條件