第四章：特殊數據結構 · ANSI Common Lisp 中文翻譯版

在之前的章節里，我們討論了列表，Lisp 最多功能的數據結構。本章將演示如何使用 Lisp 其它的數據結構：數組（包含向量與字符串），結構以及哈希表。它們或許不像列表這么靈活，但存取速度更快并使用了更少空間。 Common Lisp 還有另一種數據結構：實例（instance）。實例將在 11 章討論，講述 CLOS。 [TOC] ## 4.1 數組 (Array)[](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#array "Permalink to this headline") 在 Common Lisp 里，你可以調用?`make-array`?來構造一個數組，第一個實參為一個指定數組維度的列表。要構造一個?`2?x?3`?的數組，我們可以： ~~~ > (setf arr (make-array '(2 3) :initial-element nil)) #<Simple-Array T (2 3) BFC4FE> ~~~ Common Lisp 的數組至少可以達到七個維度，每個維度至少可以容納 1023 個元素。 `:initial-element`?實參是選擇性的。如果有提供這個實參，整個數組會用這個值作為初始值。若試著取出未初始化的數組內的元素，其結果為未定義（undefined）。用?`aref`?取出數組內的元素。與 Common Lisp 的存取函數一樣，?`aref`?是零索引的（zero-indexed）： ~~~ > (aref arr 0 0) NIL ~~~ 要替換數組的某個元素，我們使用?`setf`?與?`aref`?： ~~~ > (setf (aref arr 0 0) 'b) B > (aref arr 0 0) B ~~~ 要表示字面常量的數組（literal array），使用?`#na`?語法，其中?`n`?是數組的維度。舉例來說，我們可以這樣表示?`arr`?這個數組： ~~~ #2a((b nil nil) (nil nil nil)) ~~~ 如果全局變量?`*print-array*`?為真，則數組會用以下形式來顯示： ~~~ > (setf *print-array* t) T > arr #2A((B NIL NIL) (NIL NIL NIL)) ~~~ 如果我們只想要一維的數組，你可以給?`make-array`?第一個實參傳一個整數，而不是一個列表： ~~~ > (setf vec (make-array 4 :initial-element nil)) #(NIL NIL NIL NIL) ~~~ 一維數組又稱為向量（*vector*）。你可以通過調用?`vector`?來一步驟構造及填滿向量，向量的元素可以是任何類型： ~~~ > (vector "a" 'b 3) #("a" b 3) ~~~ 字面常量的數組可以表示成?`#na`?，字面常量的向量也可以用這種語法表達。可以用?`aref`?來存取向量，但有一個更快的函數叫做?`svref`?，專門用來存取向量。 ~~~ > (svref vec 0) NIL ~~~ 在?`svref`?內的 “sv” 代表“簡單向量”（“simple vector”），所有的向量缺省是簡單向量。?[[1]](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#id5) ## 4.2 示例：二叉搜索 (Example: Binary Search)[](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#example-binary-search "Permalink to this headline") 作為一個示例，這小節演示如何寫一個在排序好的向量里搜索對象的函數。如果我們知道一個向量是排序好的，我們可以比（65頁）`find`?做的更好，?`find`?必須依序檢查每一個元素。我們可以直接跳到向量中間開始找。如果中間的元素是我們要找的對象，搜索完畢。要不然我們持續往左半部或往右半部搜索，取決于對象是小于或大于中間的元素。圖 4.1 包含了一個這么工作的函數。其實這兩個函數：?`bin-search`?設置初始范圍及發送控制信號給?`finder`?，?`finder`?尋找向量?`vec`內?`obj`?是否介于?`start`?及?`end`?之間。 ~~~ (defun bin-search (obj vec) (let ((len (length vec))) (and (not (zerop len)) (finder obj vec 0 (- len 1))))) (defun finder (obj vec start end) (let ((range (- end start))) (if (zerop range) (if (eql obj (aref vec start)) obj nil) (let ((mid (+ start (round (/ range 2))))) (let ((obj2 (aref vec mid))) (if (< obj obj2) (finder obj vec start (- mid 1)) (if (> obj obj2) (finder obj vec (+ mid 1) end) obj))))))) ~~~ 圖 4.1: 搜索一個排序好的向量如果要找的?`range`?縮小至一個元素，而如果這個元素是?`obj`?的話，則?`finder`?直接返回這個元素，反之返回?`nil`?。如果?`range`?大于`1`?，我們設置?`middle`?(?`round`?返回離實參最近的整數) 為?`obj2`?。如果?`obj`?小于?`obj2`?，則遞歸地往向量的左半部尋找。如果?`obj`大于?`obj2`?，則遞歸地往向量的右半部尋找。剩下的一個選擇是?`obj=obj2`?，在這個情況我們找到要找的元素，直接返回這個元素。如果我們插入下面這行至?`finder`?的起始處： ~~~ (format t "~A~%" (subseq vec start (+ end 1))) ~~~ 我們可以觀察被搜索的元素的數量，是每一步往左減半的： ~~~ > (bin-search 3 #(0 1 2 3 4 5 6 7 8 9)) #(0 1 2 3 4 5 6 7 8 9) #(0 1 2 3) #(3) 3 ~~~ ## 4.3 字符與字符串 (Strings and Characters)[](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#strings-and-characters "Permalink to this headline") 字符串是字符組成的向量。我們用一系列由雙引號包住的字符，來表示一個字符串常量，而字符?`c`?用?`#\c`?表示。每個字符都有一個相關的整數 ── 通常是 ASCII 碼，但不一定是。在多數的 Lisp 實現里，函數?`char-code`?返回與字符相關的數字，而?`code-char`?返回與數字相關的字符。字符比較函數?`char<`?（小于），?`char<=`?（小于等于)，?`char=`?（等于)，?`char>=`?（大于等于) ，?`char>`?（大于)，以及?`char/=`?（不同)。他們的工作方式和 146 頁（譯注 9.3 節)比較數字用的操作符一樣。 ~~~ > (sort "elbow" #'char<) "below" ~~~ 由于字符串是字符向量，序列與數組的函數都可以用在字符串。你可以用?`aref`?來取出元素，舉例來說， ~~~ > (aref "abc" 1) #\b ~~~ 但針對字符串可以使用更快的?`char`?函數： ~~~ > (char "abc" 1) #\b ~~~ 可以使用?`setf`?搭配?`char`?（或?`aref`?）來替換字符串的元素： ~~~ > (let ((str (copy-seq "Merlin"))) (setf (char str 3) #\k) str) ~~~ 如果你想要比較兩個字符串，你可以使用通用的?`equal`?函數，但還有一個比較函數，是忽略字母大小寫的?`string-equal`?： ~~~ > (equal "fred" "fred") T > (equal "fred" "Fred") NIL >(string-equal "fred" "Fred") T ~~~ Common Lisp 提供大量的操控、比較字符串的函數。收錄在附錄 D，從 364 頁開始。有許多方式可以創建字符串。最普遍的方式是使用?`format`?。將第一個參數設為?`nil`?來調用?`format`?，使它返回一個原本會印出來的字符串： ~~~ > (format nil "~A or ~A" "truth" "dare") "truth or dare" ~~~ 但若你只想把數個字符串連結起來，你可以使用?`concatenate`?，它接受一個特定類型的符號，加上一個或多個序列： ~~~ > (concatenate 'string "not " "to worry") "not to worry" ~~~ ## 4.4 序列 (Sequences)[](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#sequences "Permalink to this headline") 在 Common Lisp 里，序列類型包含了列表與向量（因此也包含了字符串）。有些用在列表的函數，實際上是序列函數，包括`remove`?、?`length`?、?`subseq`?、?`reverse`?、?`sort`?、?`every`?以及?`some`?。所以 46 頁（譯注 3.11 小節的?`mirror?`?函數）我們所寫的函數，也可以用在其他種類的序列上： ~~~ > (mirror? "abba") T ~~~ 我們已經看過四種用來取出序列元素的函數：給列表使用的?`nth`?，給向量使用的?`aref`?及?`svref`?，以及給字符串使用的?`char`?。 Common Lisp 也提供了通用的?`elt`?，對任何種類的序列都有效： ~~~ > (elt '(a b c) 1) B ~~~ 針對特定類型的序列，特定的存取函數會比較快，所以使用?`elt`?是沒有意義的，除非在代碼當中，有需要支持通用序列的地方。使用?`elt`?，我們可以寫一個針對向量來說更有效率的?`mirror?`?版本： ~~~ (defun mirror? (s) (let ((len (length s))) (and (evenp len) (do ((forward 0 (+ forward 1)) (back (- len 1) (- back 1))) ((or (> forward back) (not (eql (elt s forward) (elt s back)))) (> forward back)))))) ~~~ 這個版本也可用在列表，但這個實現更適合給向量使用。頻繁的對列表調用?`elt`?的代價是昂貴的，因為列表僅允許順序存取。而向量允許隨機存取，從任何元素來存取每一個元素都是廉價的。許多序列函數接受一個或多個，由下表所列的標準關鍵字參數： | 參數 | 用途 | 缺省值 | | --- | --- | --- | | :key | 應用至每個元素的函數 | identity | | :test | 作來比較的函數 | eql | | :from-end | 若為真，反向工作。 | nil | | :start | 起始位置 | 0 | | :end | 若有給定，結束位置。 | nil | 一個接受所有關鍵字參數的函數是?`position`?，返回序列中一個元素的位置，未找到元素時則返回?`nil`?。我們使用?`position`?來演示關鍵字參數所扮演的角色。 ~~~ > (position #\a "fantasia") 1 > (position #\a "fantasia" :start 3 :end 5) 4 ~~~ 第二個例子我們要找在第四個與第六個字符間，第一個?`a`?所出現的位置。?`:start`?關鍵字參數是第一個被考慮的元素位置，缺省是序列的第一個元素。?`:end`?關鍵字參數，如果有給的話，是第一個不被考慮的元素位置。如果我們給入?`:from-end`?關鍵字參數， ~~~ > (position #\a "fantasia" :from-end t) 7 ~~~ 我們得到最靠近結尾的?`a`?的位置。但位置是像平常那樣計算；而不是從尾端算回來的距離。 `:key`?關鍵字參數是序列中每個元素在被考慮之前，應用至元素上的函數。如果我們說， ~~~ > (position 'a '((c d) (a b)) :key #'car) 1 ~~~ 那么我們要找的是，元素的?`car`?部分是符號?`a`?的第一個元素。 `:test`?關鍵字參數接受需要兩個實參的函數，并定義了怎樣是一個成功的匹配。缺省函數為?`eql`?。如果你想要匹配一個列表，你也許想使用?`equal`?來取代： ~~~ > (position '(a b) '((a b) (c d))) NIL > (position '(a b) '((a b) (c d)) :test #'equal) 0 ~~~ `:test`?關鍵字參數可以是任何接受兩個實參的函數。舉例來說，給定?`<`?，我們可以詢問第一個使第一個參數比它小的元素位置： ~~~ > (position 3 '(1 0 7 5) :test #'<) 2 ~~~ 使用?`subseq`?與?`position`?，我們可以寫出分開序列的函數。舉例來說，這個函數 ~~~ (defun second-word (str) (let ((p1 (+ (position #\ str) 1))) (subseq str p1 (position #\ str :start p1)))) ~~~ 返回字符串中第一個單字空格后的第二個單字： ~~~ > (second-word "Form follows function") "follows" ~~~ 要找到滿足謂詞的元素，其中謂詞接受一個實參，我們使用?`position-if`?。它接受一個函數與序列，并返回第一個滿足此函數的元素： ~~~ > (position-if #'oddp '(2 3 4 5)) 1 ~~~ `position-if`?接受除了?`:test`?之外的所有關鍵字參數。有許多相似的函數，如給序列使用的?`member`?與?`member-if`?。分別是，?`find`?（接受全部關鍵字參數）與?`find-if`?（接受除了?`:test`之外的所有關鍵字參數）： ~~~ > (find #\a "cat") #\a > (find-if #'characterp "ham") #\h ~~~ 不同于?`member`?與?`member-if`?，它們僅返回要尋找的對象。通常一個?`find-if`?的調用，如果解讀為?`find`?搭配一個?`:key`?關鍵字參數的話，會顯得更清楚。舉例來說，表達式 ~~~ (find-if #'(lambda (x) (eql (car x) 'complete)) lst) ~~~ 可以更好的解讀為 ~~~ (find 'complete lst :key #'car) ~~~ 函數?`remove`?（22 頁）以及?`remove-if`?通常都可以用在序列。它們跟?`find`?與?`find-if`?是一樣的關系。另一個相關的函數是`remove-duplicates`?，僅保留序列中每個元素的最后一次出現。 ~~~ > (remove-duplicates "abracadabra") "cdbra" ~~~ 這個函數接受前表所列的所有關鍵字參數。函數?`reduce`?用來把序列壓縮成一個值。它至少接受兩個參數，一個函數與序列。函數必須是接受兩個實參的函數。在最簡單的情況下，一開始函數用序列前兩個元素作為實參來調用，之后接續的元素作為下次調用的第二個實參，而上次返回的值作為下次調用的第一個實參。最后調用最終返回的值作為?`reduce`?整個函數的返回值。也就是說像是這樣的表達式： ~~~ (reduce #'fn '(a b c d)) ~~~ 等同于 ~~~ (fn (fn (fn 'a 'b) 'c) 'd) ~~~ 我們可以使用?`reduce`?來擴充只接受兩個參數的函數。舉例來說，要得到三個或多個列表的交集(intersection)，我們可以： ~~~ > (reduce #'intersection '((b r a d 's) (b a d) (c a t))) (A) ~~~ ## 4.5 示例：解析日期 (Example: Parsing Dates)[](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#example-parsing-dates "Permalink to this headline") 作為序列操作的示例，本節演示了如何寫程序來解析日期。我們將編寫一個程序，可以接受像是 “16 Aug 1980” 的字符串，然后返回一個表示日、月、年的整數列表。 ~~~ (defun tokens (str test start) (let ((p1 (position-if test str :start start))) (if p1 (let ((p2 (position-if #'(lambda (c) (not (funcall test c))) str :start p1))) (cons (subseq str p1 p2) (if p2 (tokens str test p2) nil))) nil))) (defun constituent (c) (and (graphic-char-p c) (not (char= c #\ )))) ~~~ 圖 4.2 辨別符號 (token) 圖 4.2 里包含了某些在這個應用里所需的通用解析函數。第一個函數?`tokens`?，用來從字符串中取出語元（token）。給定一個字符串及測試函數，滿足測試函數的字符組成子字符串，子字符串再組成列表返回。舉例來說，如果測試函數是對字母返回真的?`alpha-char-p`?函數，我們得到： ~~~ > (tokens "ab12 3cde.f" #'alpha-char-p 0) ("ab" "cde" "f") ~~~ 所有不滿足此函數的字符被視為空白 ── 他們是語元的分隔符，但永遠不是語元的一部分。函數?`constituent`?被定義成用來作為?`tokens`?的實參。在 Common Lisp 里，*圖形字符*是我們可見的字符，加上空白字符。所以如果我們用?`constituent`?作為測試函數時， ~~~ > (tokens "ab12 3cde.f gh" #'constituent 0) ("ab12" "3cde.f" "gh") ~~~ 則語元將會由空白區分出來。圖 4.3 包含了特別為解析日期打造的函數。函數?`parse-date`?接受一個特別形式組成的日期，并返回代表這個日期的整數列表： ~~~ > (parse-date "16 Aug 1980") (16 8 1980) ~~~ ~~~ (defun parse-date (str) (let ((toks (tokens str #'constituent 0))) (list (parse-integer (first toks)) (parse-month (second toks)) (parse-integer (third toks))))) (defconstant month-names #("jan" "feb" "mar" "apr" "may" "jun" "jul" "aug" "sep" "oct" "nov" "dec")) (defun parse-month (str) (let ((p (position str month-names :test #'string-equal))) (if p (+ p 1) nil))) ~~~ 圖 4.3 解析日期的函數 `parse-date`?使用?`tokens`?來解析日期字符串，接著調用?`parse-month`?及?`parse-integer`?來轉譯年、月、日。要找到月份，調用`parse-month`?，由于使用的是?`string-equal`?來匹配月份的名字，所以輸入可以不分大小寫。要找到年和日，調用內置的?`parse-integer`?，?`parse-integer`?接受一個字符串并返回對應的整數。如果需要自己寫程序來解析整數，也許可以這么寫： ~~~ (defun read-integer (str) (if (every #'digit-char-p str) (let ((accum 0)) (dotimes (pos (length str)) (setf accum (+ (* accum 10) (digit-char-p (char str pos))))) accum) nil)) ~~~ 這個定義演示了在 Common Lisp 中，字符是如何轉成數字的 ── 函數?`digit-char-p`?不僅測試字符是否為數字，同時返回了對應的整數。 ## 4.6 結構 (Structures)[](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#structures "Permalink to this headline") 結構可以想成是豪華版的向量。假設你要寫一個程序來追蹤長方體。你可能會想用三個向量元素來表示長方體：高度、寬度及深度。與其使用原本的?`svref`?，不如定義像是下面這樣的抽象，程序會變得更容易閱讀， ~~~ (defun block-height (b) (svref b 0)) ~~~ 而結構可以想成是，這些函數通通都替你定義好了的向量。要想定義結構，使用?`defstruct`?。在最簡單的情況下，只要給出結構及字段的名字便可以了： ~~~ (defstruct point x y) ~~~ 這里定義了一個?`point`?結構，具有兩個字段?`x`?與?`y`?。同時隱式地定義了?`make-point`?、?`point-p`?、?`copy-point`?、?`point-x`?及`point-y`?函數。 2.3 節提過， Lisp 程序可以寫出 Lisp 程序。這是目前所見的明顯例子之一。當你調用?`defstruct`?時，它自動生成了其它幾個函數的定義。有了宏以后，你將可以自己來辦到同樣的事情（如果需要的話，你甚至可以自己寫出?`defstruct`?）。每一個?`make-point`?的調用，會返回一個新的?`point`?。可以通過給予對應的關鍵字參數，來指定單一字段的值： ~~~ (setf p (make-point :x 0 :y 0)) #S(POINT X 0 Y 0) ~~~ 存取?`point`?字段的函數不僅被定義成可取出數值，也可以搭配?`setf`?一起使用。 ~~~ > (point-x p) 0 > (setf (point-y p) 2) 2 > p #S(POINT X 0 Y 2) ~~~ 定義結構也定義了以結構為名的類型。每個點的類型層級會是，類型?`point`?，接著是類型?`structure`?，再來是類型?`atom`?，最后是`t`?類型。所以使用?`point-p`?來測試某個東西是不是一個點時，也可以使用通用性的函數，像是?`typep`?來測試。 ~~~ > (point-p p) T > (typep p 'point) T ~~~ 我們可以在本來的定義中，附上一個列表，含有字段名及缺省表達式，來指定結構字段的缺省值。 ~~~ (defstruct polemic (type (progn (format t "What kind of polemic was it? ") (read))) (effect nil)) ~~~ 如果?`make-polemic`?調用沒有給字段指定初始值，則字段會被設成缺省表達式的值： ~~~ > (make-polemic) What kind of polemic was it? scathing #S(POLEMIC :TYPE SCATHING :EFFECT NIL) ~~~ 結構顯示的方式也可以控制，以及結構自動產生的存取函數的字首。以下是做了前述兩件事的?`point`?定義： ~~~ (defstruct (point (:conc-name p) (:print-function print-point)) (x 0) (y 0)) (defun print-point (p stream depth) (format stream "#<~A, ~A>" (px p) (py p))) ~~~ `:conc-name`?關鍵字參數指定了要放在字段前面的名字，并用這個名字來生成存取函數。預設是?`point-`?；現在變成只有?`p`?。不使用缺省的方式使代碼的可讀性些微降低了，只有在需要常常用到這些存取函數時，你才會想取個短點的名字。 `:print-function`?是在需要顯示結構出來看時，指定用來打印結構的函數 ── 需要顯示的情況比如，要在頂層顯示時。這個函數需要接受三個實參：要被印出的結構，在哪里被印出，第三個參數通常可以忽略。?[[2]](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#id6)?我們會在 7.1 節討論流（stream）。現在來說，只要知道流可以作為參數傳給?`format`?就好了。函數?`print-point`?會用縮寫的形式來顯示點： ~~~ > (make-point) #<0,0> ~~~ ## 4.7 示例：二叉搜索樹 (Example: Binary Search Tree)[](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#example-binary-search-tree "Permalink to this headline") 由于?`sort`?本身系統就有了，極少需要在 Common Lisp 里編寫排序程序。本節將演示如何解決一個與此相關的問題，這個問題尚未有現成的解決方案：維護一個已排序的對象集合。本節的代碼會把對象存在二叉搜索樹里（?*binary search tree*?）或稱作 BST。當二叉搜索樹平衡時，允許我們可以在與時間成?`log?n`?比例的時間內，來尋找、添加或是刪除元素，其中?`n`?是集合的大小。 ![../_images/Figure-4.4.png](http://acl.readthedocs.org/en/latest/_images/Figure-4.4.png) 圖 4.4: 二叉搜索樹二叉搜索樹是一種二叉樹，給定某個排序函數，比如?`<`?，每個元素的左子樹都?`<`?該元素，而該元素?`<`?其右子樹。圖 4.4 展示了根據`<`?排序的二叉樹。圖 4.5 包含了二叉搜索樹的插入與尋找的函數。基本的數據結構會是?`node`?（節點），節點有三個部分：一個字段表示存在該節點的對象，以及各一個字段表示節點的左子樹及右子樹。可以把節點想成是有一個?`car`?和兩個?`cdr`?的一個 cons 核（cons cell）。 ~~~ (defstruct (node (:print-function (lambda (n s d) (format s "#<~A>" (node-elt n))))) elt (l nil) (r nil)) (defun bst-insert (obj bst <) (if (null bst) (make-node :elt obj) (let ((elt (node-elt bst))) (if (eql obj elt) bst (if (funcall < obj elt) (make-node :elt elt :l (bst-insert obj (node-l bst) <) :r (node-r bst)) (make-node :elt elt :r (bst-insert obj (node-r bst) <) :l (node-l bst))))))) (defun bst-find (obj bst <) (if (null bst) nil (let ((elt (node-elt bst))) (if (eql obj elt) bst (if (funcall < obj elt) (bst-find obj (node-l bst) <) (bst-find obj (node-r bst) <)))))) (defun bst-min (bst) (and bst (or (bst-min (node-l bst)) bst))) (defun bst-max (bst) (and bst (or (bst-max (node-r bst)) bst))) ~~~ 圖 4.5 二叉搜索樹：查詢與插入一棵二叉搜索樹可以是?`nil`?或是一個左子、右子樹都是二叉搜索樹的節點。如同列表可由連續調用?`cons`?來構造，二叉搜索樹將可以通過連續調用?`bst-insert`?來構造。這個函數接受一個對象，一棵二叉搜索樹及一個排序函數，并返回將對象插入的二叉搜索樹。和`cons`?函數一樣，?`bst-insert`?不改動做為第二個實參所傳入的二叉搜索樹。以下是如何使用這個函數來構造一棵叉搜索樹： ~~~ > (setf nums nil) NIL > (dolist (x '(5 8 4 2 1 9 6 7 3)) (setf nums (bst-insert x nums #'<))) NIL ~~~ 圖 4.4 顯示了此時?`nums`?的結構所對應的樹。我們可以使用?`bst-find`?來找到二叉搜索樹中的對象，它與?`bst-insert`?接受同樣的參數。先前敘述所提到的?`node`?結構，它像是一個具有兩個?`cdr`?的 cons 核。如果我們把 16 頁的?`our-member`?拿來與?`bst-find`?比較的話，這樣的類比更加明確。與?`member`?相同，?`bst-find`?不僅返回要尋找的元素，也返回了用尋找元素做為根節點的子樹： ~~~ > (bst-find 12 nums #'<) NIL > (bst-find 4 nums #'<) #<4> ~~~ 這使我們可以區分出無法找到某個值，以及成功找到?`nil`?的情況。要找到二叉搜索樹的最小及最大的元素是很簡單的。要找到最小的，我們沿著左子樹的路徑走，如同?`bst-min`?所做的。要找到最大的，沿著右子樹的路徑走，如同?`bst-max`?所做的： ~~~ > (bst-min nums) #<1> > (bst-max nums) #<9> ~~~ 要從二叉搜索樹里移除元素一樣很快，但需要更多代碼。圖 4.6 演示了如何從二叉搜索樹里移除元素。 ~~~ (defun bst-remove (obj bst <) (if (null bst) nil (let ((elt (node-elt bst))) (if (eql obj elt) (percolate bst) (if (funcall < obj elt) (make-node :elt elt :l (bst-remove obj (node-l bst) <) :r (node-r bst)) (make-node :elt elt :r (bst-remove obj (node-r bst) <) :l (node-l bst))))))) (defun percolate (bst) (cond ((null (node-l bst)) (if (null (node-r bst)) nil (rperc bst))) ((null (node-r bst)) (lperc bst)) (t (if (zerop (random 2)) (lperc bst) (rperc bst))))) (defun rperc (bst) (make-node :elt (node-elt (node-r bst)) :l (node-l bst) :r (percolate (node-r bst)))) ~~~ 圖 4.6 二叉搜索樹：移除 **勘誤:**?此版?`bst-remove`?的定義已被匯報是壞掉的，請參考?[這里](https://gist.github.com/2868263)?獲得修復版。函數?`bst-remove`?接受一個對象，一棵二叉搜索樹以及排序函數，并返回一棵與本來的二叉搜索樹相同的樹，但不包含那個要移除的對象。和?`remove`?一樣，它不改動做為第二個實參所傳入的二叉搜索樹： ~~~ > (setf nums (bst-remove 2 nums #'<)) #<5> > (bst-find 2 nums #'<) NIL ~~~ 此時?`nums`?的結構應該如圖 4.7 所示。（另一個可能性是?`1`?取代了?`2`?的位置。） ![../_images/Figure-4.7.png](http://acl.readthedocs.org/en/latest/_images/Figure-4.7.png) 圖 4.7: 二叉搜索樹移除需要做更多工作，因為從內部節點移除一個對象時，會留下一個空缺，需要由其中一個孩子來填補。這是?`percolate`?函數的用途。當它替換一個二叉搜索樹的樹根（topmost element）時，會找其中一個孩子來替換，并用此孩子的孩子來填補，如此這般一直遞歸下去。為了要保持樹的平衡，如果有兩個孩子時，?`perlocate`?隨機擇一替換。表達式?`(random?2)`?會返回?`0`?或?`1`?，所以?`(zerop?(random2))`?會返回真或假。 ~~~ (defun bst-traverse (fn bst) (when bst (bst-traverse fn (node-l bst)) (funcall fn (node-elt bst)) (bst-traverse fn (node-r bst)))) ~~~ 圖 4.8 二叉搜索樹：遍歷一旦我們把一個對象集合插入至二叉搜索樹時，中序遍歷會將它們由小至大排序。這是圖 4.8 中，?`bst-traverse`?函數的用途： ~~~ > (bst-traverse #'princ nums) 13456789 NIL ~~~ （函數?`princ`?僅顯示單一對象）本節所給出的代碼，提供了一個二叉搜索樹實現的腳手架。你可能想根據應用需求，來充實這個腳手架。舉例來說，這里所給出的代碼每個節點只有一個?`elt`?字段；在許多應用里，有兩個字段會更有意義，?`key`?與?`value`?。本章的這個版本把二叉搜索樹視為集合看待，從這個角度看，重復的插入是被忽略的。但是代碼可以很簡單地改動，來處理重復的元素。二叉搜索樹不僅是維護一個已排序對象的集合的方法。他們是否是最好的方法，取決于你的應用。一般來說，二叉搜索樹最適合用在插入與刪除是均勻分布的情況。有一件二叉搜索樹不擅長的事，就是用來維護優先隊列（priority queues）。在一個優先隊列里，插入也許是均勻分布的，但移除總是在一個另一端。這會導致一個二叉搜索樹變得不平衡，而我們期望的復雜度是?`O(log(n))`?插入與移除操作，將會變成?`O(n)`?。如果用二叉搜索樹來表示一個優先隊列，也可以使用一般的列表，因為二叉搜索樹最終會作用的像是個列表。 ## 4.8 哈希表 (Hash Table)[](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#hash-table "Permalink to this headline") 第三章演示過列表可以用來表示集合（sets）與映射（mappings）。但當列表的長度大幅上升時（或是 10 個元素），使用哈希表的速度比較快。你通過調用?`make-hash-table`?來構造一個哈希表，它不需要傳入參數： ~~~ > (setf ht (make-hash-table)) #<Hash-Table BF0A96> ~~~ 和函數一樣，哈希表總是用?`#<...>`?的形式來顯示。一個哈希表，與一個關聯列表類似，是一種表達對應關系的方式。要取出與給定鍵值有關的數值，我們調用?`gethash`?并傳入一個鍵值與哈希表。預設情況下，如果沒有與這個鍵值相關的數值，?`gethash`?會返回?`nil`?。 ~~~ > (gethash 'color ht) NIL NIL ~~~ 在這里我們首次看到 Common Lisp 最突出的特色之一：一個表達式竟然可以返回多個數值。函數?`gethash`?返回兩個數值。第一個值是與鍵值有關的數值，第二個值說明了哈希表是否含有任何用此鍵值來儲存的數值。由于第二個值是?`nil`?，我們知道第一個?`nil`是缺省的返回值，而不是因為?`nil`?是與?`color`?有關的數值。大部分的實現會在頂層顯示一個函數調用的所有返回值，但僅期待一個返回值的代碼，只會收到第一個返回值。 5.5 節會說明，代碼如何接收多個返回值。要把數值與鍵值作關聯，使用?`gethash`?搭配?`setf`?： ~~~ > (setf (gethash 'color ht) 'red) RED ~~~ 現在如果我們再次調用?`gethash`?，我們會得到我們剛插入的值： ~~~ > (gethash 'color ht) RED T ~~~ 第二個返回值證明，我們取得了一個真正儲存的對象，而不是預設值。存在哈希表的對象或鍵值可以是任何類型。舉例來說，如果我們要保留函數的某種訊息，我們可以使用哈希表，用函數作為鍵值，字符串作為詞條（entry）： ~~~ > (setf bugs (make-hash-table)) #<Hash-Table BF4C36> > (push "Doesn't take keyword arguments." (gethash #'our-member bugs)) ("Doesn't take keyword arguments.") ~~~ 由于?`gethash`?缺省返回?`nil`?，而?`push`?是?`setf`?的縮寫，可以輕松的給哈希表新添一個詞條。（有困擾的?`our-member`?定義在 16 頁。）可以用哈希表來取代用列表表示集合。當集合變大時，哈希表的查詢與移除會來得比較快。要新增一個成員到用哈希表所表示的集合，把?`gethash`?用?`setf`?設成?`t`?： ~~~ > (setf fruit (make-hash-table)) #<Hash-Table BFDE76> > (setf (gethash 'apricot fruit) t) T ~~~ 然后要測試是否為成員，你只要調用： ~~~ > (gethash 'apricot fruit) T T ~~~ 由于?`gethash`?缺省返回真，一個新創的哈希表，會很方便地是一個空集合。要從集合中移除一個對象，你可以調用?`remhash`?，它從一個哈希表中移除一個詞條： ~~~ > (remhash 'apricot fruit) T ~~~ 返回值說明了是否有詞條被移除；在這個情況里，有。哈希表有一個迭代函數：?`maphash`?，它接受兩個實參，接受兩個參數的函數以及哈希表。該函數會被每個鍵值對調用，沒有特定的順序： ~~~ > (setf (gethash 'shape ht) 'spherical (gethash 'size ht) 'giant) GIANT > (maphash #'(lambda (k v) (format t "~A = ~A~%" k v)) ht) SHAPE = SPHERICAL SIZE = GIANT COLOR = RED NIL ~~~ `maphash`?總是返回?`nil`?，但你可以通過傳入一個會累積數值的函數，把哈希表的詞條存在列表里。哈希表可以容納任何數量的元素，但當哈希表空間用完時，它們會被擴張。如果你想要確保一個哈希表，從特定數量的元素空間大小開始時，可以給?`make-hash-table`?一個選擇性的?`:size`?關鍵字參數。做這件事情有兩個理由：因為你知道哈希表會變得很大，你想要避免擴張它；或是因為你知道哈希表會是很小，你不想要浪費內存。?`:size`?參數不僅指定了哈希表的空間，也指定了元素的數量。平均來說，在被擴張前所能夠容納的數量。所以 `(make-hash-table?:size?5)` 會返回一個預期存放五個元素的哈希表。和任何牽涉到查詢的結構一樣，哈希表一定有某種比較鍵值的概念。預設是使用?`eql`?，但你可以提供一個額外的關鍵字參數?`:test`來告訴哈希表要使用?`eq`?，?`equal`?，還是?`equalp`?： ~~~ > (setf writers (make-hash-table :test #'equal)) #<Hash-Table C005E6> > (setf (gethash '(ralph waldo emerson) writers) t) T ~~~ 這是一個讓哈希表變得有效率的取舍之一。有了列表，我們可以指定?`member`?為判斷相等性的謂詞。有了哈希表，我們可以預先決定，并在哈希表構造時指定它。大多數 Lisp 編程的取舍（或是生活，就此而論）都有這種特質。起初你想要事情進行得流暢，甚至賠上效率的代價。之后當代碼變得沉重時，你犧牲了彈性來換取速度。 ## Chapter 4 總結 (Summary)[](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#chapter-4-summary "Permalink to this headline") 1. Common Lisp 支持至少 7 個維度的數組。一維數組稱為向量。 2. 字符串是字符的向量。字符本身就是對象。 3. 序列包括了向量與列表。許多序列函數都接受標準的關鍵字參數。 4. 處理字符串的函數非常多，所以用 Lisp 來解析字符串是小菜一碟。 5. 調用?`defstruct`?定義了一個帶有命名字段的結構。它是一個程序能寫出程序的好例子。 6. 二叉搜索樹見長于維護一個已排序的對象集合。 7. 哈希表提供了一個更有效率的方式來表示集合與映射 (mappings)。 ## Chapter 4 習題 (Exercises)[](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#chapter-4-exercises "Permalink to this headline") 1. 定義一個函數，接受一個平方數組（square array，一個相同維度的數組?`(n?n)`?)，并將它順時針轉 90 度。 ~~~ > (quarter-turn #2A((a b) (c d))) #2A((C A) (D B)) ~~~ 你會需要用到 361 頁的?`array-dimensions`?。 1. 閱讀 368 頁的?`reduce`?說明，然后用它來定義： ~~~ (a) copy-list (b) reverse（針對列表） ~~~ 1. 定義一個結構來表示一棵樹，其中每個節點包含某些數據及三個小孩。定義： ~~~ (a) 一個函數來復制這樣的樹（復制完的節點與本來的節點是不相等（ `eql` ）的） (b) 一個函數，接受一個對象與這樣的樹，如果對象與樹中各節點的其中一個字段相等時，返回真。 ~~~ 1. 定義一個函數，接受一棵二叉搜索樹，并返回由此樹元素所組成的，一個由大至小排序的列表。 2. 定義?`bst-adjoin`?。這個函數應與?`bst-insert`?接受相同的參數，但應該只在對象不等于任何樹中對象時將其插入。 **勘誤:**?`bst-adjoin`?的功能與?`bst-insert`?一模一樣。 1. 任何哈希表的內容可以由關聯列表（assoc-list）來描述，其中列表的元素是?`(k?.?v)`?的形式，對應到哈希表中的每一個鍵值對。定義一個函數： ~~~ (a) 接受一個關聯列表，并返回一個對應的哈希表。 (b) 接受一個哈希表，并返回一個對應的關聯列表。 ~~~ 腳注 [[1]](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#id2) | 一個簡單數組大小是不可調整、元素也不可替換的，并不含有填充指針（fill-pointer）。數組缺省是簡單的。簡單向量是個一維的簡單數組，可以含有任何類型的元素。 [[2]](http://acl.readthedocs.org/en/latest/zhCN/ch4-cn.html#id3) | 在 ANSI Common Lisp 里，你可以給一個?`:print-object`?的關鍵字參數來取代，它只需要兩個實參。也有一個宏叫做`print-unreadable-object`?，能用則用，可以用?`#<...>`?的語法來顯示對象。