第六章高階函數 · Haskell趣學指南

[TOC] ![2015-07-20/55ad0aed694be](http://box.kancloud.cn/2015-07-20_55ad0aed694be.png) haskell中的函數可以作為參數和返回值傳來傳去，這樣的函數就被稱作高階函數。高階函數可不只是某簡單特性而已，它貫穿于haskell的方方面面。要拒絕循環與狀態的改變而通過定義問題"是什么"來解決問題，高階函數必不可少。它們是編碼的得力工具。 ## 柯里函數本質上，haskell的所有函數都只有一個參數，那么我們先前編那么多含有多個參數的函數又是怎么回事? 呵，小伎倆! 所有多個參數的函數都是柯里函數。什么意思呢? 取一個例子最好理解，就拿我們的好朋友`max`函數說事吧。它看起來像是取兩個參數，返回較大的那個數。實際上，執行`max 4 5`時，它會首先返回一個取一個參數的函數，其返回值不是4就是該參數，取決于誰大。然后，以5為參數調用它，并取得最終結果。這聽著挺繞口的，不過這一概念十分的酷! 如下的兩個調用是等價的： ~~~ ghci>?max?4?5? 5? ghci>?(max?4)?5? 5 ~~~ ![](http://box.kancloud.cn/2015-07-20_55ad0aa5ddc5e.png) 把空格放到兩個東西之間，稱作**函數調用**。它有點像個運算符，并擁有最高的優先級。看看max函數的類型:`max :: (Ord a) => a -> a -> a`。也可以寫作:`max :: (Ord a) => a -> (a -> a)`。可以讀作max取一個參數a，并返回一個函數(就是那個`->`)，這個函數取一個a類型的參數，返回一個a。這便是為何只用箭頭來分隔參數和返回值類型。這樣的好處又是如何? 簡言之，我們若以不全的參數來調用某函數，就可以得到一個**不全調用**的函數。如果你高興，構造新函數就可以如此便捷，將其傳給另一個函數也是同樣方便。看下這個函數，簡單至極: ~~~ multThree?::?(Num?a)?=>?a?->?a?->?a?->?a? multThree?x?y?z?=?x?*?y?*?z ~~~ 我們若執行`mulThree 3 5 9`或`((mulThree 3) 5) 9`，它背后是如何運作呢？首先，按照空格分隔，把`3`交給`mulThree`。這返回一個返回函數的函數。然后把`5`交給它，返回一個取一個參數并使之乘以`15`的函數。最后把`9`交給這一函數，返回`135`。想想，這個函數的類型也可以寫作`multThree :: (Num a) => a -> (a -> (a -> a))`，`->`前面的東西就是函數取的參數，后面的東西就是其返回值。所以說，我們的函數取一個`a`，并返回一個類型為`(Num a) => a -> (a -> a)`的函數，類似，這一函數返回一個取一個`a`，返回一個類型為`(Num a) => a -> a`的函數。而最后的這個函數就只取一個`a`并返回一個`a`，如下: ~~~ ghci>?let?multTwoWithNine?=?multThree?9? ghci>?multTwoWithNine?2?3? 54? ghci>?let?multWithEighteen?=?multTwoWithNine?2? ghci>?multWithEighteen?10? 180 ~~~ 前面提到，以不全的參數調用函數可以方便地創造新的函數。例如，搞個取一數與100比較大小的函數該如何? 大可這樣: ~~~ compareWithHundred?::?(Num?a，Ord?a)?=>?a?->?Ordering? compareWithHundred?x?=?compare?100?x ~~~ 用99調用它，就可以得到一個`GT`。簡單。注意下在等號兩邊都有x。想想`compare 100`會返回什么？一個取一數與100比較的函數。 Wow，這不正是我們想要的? 這樣重寫: ~~~ compareWithHundred?::?(Num?a，Ord?a)?=>?a?->?Ordering? compareWithHundred?=?compare?100 ~~~ 類型聲明依然相同，因為`compare 100`返回函數。 compare的類型為`(Ord a) => a -> (a -> Ordering)`，用100調用它后返回的函數類型為`(Num a，Ord a) => a -> Ordering`，同時由于100還是`Num`類型類的實例，所以還得另留一個類約束。 Yo! 你得保證已經弄明白了柯里函數與不全調用的原理，它們很重要！中綴函數也可以不全調用，用括號把它和一邊的參數括在一起就行了。這返回一個取一參數并將其補到缺少的那一端的函數。一個簡單函數如下: ~~~ divideByTen?::?(Floating?a)?=>?a?->?a? divideByTen?=?(/10) ~~~ 調用`divideByTen 200`就是`(/10) 200`，和`200 / 10`等價。一個檢查字符是否為大寫的函數: ~~~ isUpperAlphanum?::?Char?->?Bool? isUpperAlphanum?=?(`elem`?['A'..'Z']) ~~~ 唯一的例外就是`-`運算符，按照前面提到的定義，`(-4)`理應返回一個并將參數減4的函數，而實際上，處于計算上的方便，`(-4)`表示負`4`。若你一定要弄個將參數減4的函數，就用`subtract`好了，像這樣`(subtract 4)`. 若不用_let_給它命名或傳到另一函數中，在ghci中直接執行`multThree 3 4`會怎樣? ~~~ ghci>?multThree?3?4? :1:0:? No?instance?for?(Show?(t?->?t))? arising?from?a?use?of?`print'?at?:1:0-12? Possible?fix:?add?an?instance?declaration?for?(Show?(t?->?t))? In?the?expression:?print?it? In?a?'do'?expression:?print?it ~~~ ghci說，這一表達式返回了一個`a -> a`類型的函數，但它不知道該如何顯示它。函數不是`Show`類型類的實例，所以我們不能得到表示一函數內容的字符串。若在ghci中計算`1+1`，它會首先計算得`2`，然后調用`show 2`得到該數值的字符串表示，即"2"，再輸出到屏幕. ## 是時候了，來點高階函數！ haskell中的函數可以取另一個函數做參數，也可以返回函數。舉個例子，我們弄個取一個函數并調用它兩次的函數. ~~~ applyTwice?::?(a?->?a)?->?a?->?a??? applyTwice?f?x?=?f?(f?x) ~~~ ![](http://box.kancloud.cn/2015-07-20_55ad0aa80b4d3.png) 首先注意這類型聲明。在此之前我們很少用到括號，因為`(->)`是自然的右結合，不過在這里括號是必須的。它標明了首個參數是個參數與返回值類型都是a的函數，第二個參數與返回值的類型也都是a。我們可以用柯里函數的思路來理解這一函數，不過免得自尋煩惱，我們姑且直接把它看作是取兩個參數返回一個值，其首個參數是個類型為`(a->a)`的函數,第二個參數是個`a`。該函數的類型可以是`(Int->Int)`，也可以是`(String->String)`，但第二個參數必須與之一致。 > **Note**: 現在開始我們會直說某函數含有多個參數(除非它真的只有一個參數)。以簡潔之名，我們會說(a->a->a)取兩個參數，盡管我們知道它在背后做的手腳. 這個函數是相當的簡單，就拿參數f當函數，用x調用它得到的結果再去調用它。也就可以這樣玩: ~~~ ghci>?applyTwice?(+3)?10??? 16??? ghci>?applyTwice?(++?"?HAHA")?"HEY"??? "HEY?HAHA?HAHA"??? ghci>?applyTwice?("HAHA?"?++)?"HEY"??? "HAHA?HAHA?HEY"??? ghci>?applyTwice?(multThree?2?2)?9??? 144??? ghci>?applyTwice?(3:)?[1]??? [3,3,1] ~~~ 看，不全調用多神奇! 如果有個函數要我們給它傳個一元函數，大可以不全調用一個函數讓它剩一個參數，再把它交出去。接下來我們用高階函數的編程思想來實現個標準庫中的函數，它就是`zipWith`。它取一個函數和兩個List做參數，并把兩個List交到一起(使相應的元素去調用該函數)。如下就是我們的實現: ~~~ zipWith'?::?(a?->?b?->?c)?->?[a]?->?[b]?->?[c]??? zipWith'?_?[]?_?=?[]??? zipWith'?_?_?[]?=?[]??? zipWith'?f?(x:xs)?(y:ys)?=?f?x?y?:?zipWith'?f?xs?ys ~~~ 看下這個類型聲明，它的首個參數是個函數，取兩個參數處理交叉，其類型不必相同，不過相同也沒關系。第二三個參數都是List，返回值也是個List。第一個List中元素的類型必須是a，因為這個處理交叉的函數的第一個參數是a。第二個List中元素的類型必為b，因為這個處理交叉的函數第二個參數的類型是b。返回的List中元素類型為c。如果一個函數說取一個類型為`a->b->c`的函數做參數，傳給它個`a->a->c`類型的也是可以的，但反過來就不行了。可以記下，若在使用高階函數的時候不清楚其類型為何，就先忽略掉它的類型聲明，再到ghci下用`:t`命令來看下haskell的類型推導. 這函數的行為與普通的`zip`很相似，邊界條件也是相同，只不過多了個參數，即處理元素交叉的函數。它關不著邊界條件什么事兒，所以我們就只留一個_ 。后一個模式的函數體與zip也很像，只不過這里是`f x y`而非`(x,y)`。只要足夠通用，一個簡單的高階函數可以在不同的場合反復使用。如下便是我們`zipWith'`函數本領的冰山一角: ~~~ ghci>?zipWith'?(+)?[4,2,5,6]?[2,6,2,3]??? [6,8,7,9]??? ghci>?zipWith'?max?[6,3,2,1]?[7,3,1,5]??? [7,3,2,5]??? ghci>?zipWith'?(++)?["foo?"，"bar?"，"baz?"]?["fighters"，"hoppers"，"aldrin"]??? ["foo?fighters","bar?hoppers","baz?aldrin"]??? ghci>?zipWith'?(*)?(replicate?5?2)?[1..]??? [2,4,6,8,10]??? ghci>?zipWith'?(zipWith'?(*))?[[1,2,3],[3,5,6],[2,3,4]]?[[3,2,2],[3,4,5],[5,4,3]]??? [[3,4,6],[9,20,30],[10,12,12]] ~~~ 如你所見，一個簡單的高階函數就可以玩出很多花樣。命令式語言使用for、while、賦值、狀態檢測來實現功能，再包起來留個接口，使之像個函數一樣調用。而函數式語言使用高階函數來抽象出常見的模式，像成對遍歷并處理兩個List或從中篩掉自己不需要的結果。接下來實現標準庫中的另一個函數flip，flip簡單地取一個函數作參數并返回一個相似的函數，只是它們的兩個參數倒了個。 ~~~ flip'?::?(a?->?b?->?c)?->?(b?->?a?->?c)??? flip'?f?=?g??? ????where?g?x?y?=?f?y?x ~~~ 從這類型聲明中可以看出，它取一個函數，其參數類型分別為a和b，而它返回的函數的參數類型為b和a。由于函數默認都是柯里化的，`->`為右結合，這里的第二對括號其實并無必要，`(a -> b -> c) -> (b -> a -> c)`與`(a -> b -> c) -> (b -> (a -> c))`等價,也與`(a -> b -> c) -> b -> a -> c`等價。前面我們寫了`g x y = f y x`，既然這樣可行，那么`f y x = g x y`不也一樣? 這一來我們可以改成更簡單的寫法: ~~~ flip'?::?(a?->?b?->?c)?->?b?->?a?->?c??? flip'?f?y?x?=?f?x?y ~~~ 在這里我們就利用了柯里函數的優勢，只要調用`flip' f`而不帶`y`和`x`，它就會返回一個倆參數倒個的函數。`flip`處理的函數往往都是用來傳給其他函數調用，于是我們可以發揮柯里函數的優勢，預先想好發生完全調用的情景并處理好返回值. ~~~ ghci>?flip'?zip?[1,2,3,4,5]?"hello"??? [('h',1),('e',2),('l',3),('l',4),('o',5)]??? ghci>?zipWith?(flip'?div)?[2,2..]?[10,8,6,4,2]??? [5,4,3,2,1] ~~~ ## map 與 filter map取一個函數和List做參數，遍歷該List的每個元素來調用該函數產生一個新的List。看下它的類型聲明和實現: ~~~ map?::?(a?->?b)?->?[a]?->?[b]??? map?_?[]?=?[]??? map?f?(x:xs)?=?f?x?:?map?f?xs ~~~ 從這類型聲明中可以看出，它取一個取`a`返回`b`的函數和一組a的List，并返回一組b。這就是haskell的有趣之處：有時只看類型聲明就能對函數的行為猜個大致。`map`函數多才多藝，有一百萬種用法。如下是其中一小部分: ~~~ ghci>?map?(+3)?[1,5,3,1,6]??? [4,8,6,4,9]??? ghci>?map?(++?"!")?["BIFF"，"BANG"，"POW"]??? ["BIFF!","BANG!","POW!"]??? ghci>?map?(replicate?3)?[3..6]??? [[3,3,3],[4,4,4],[5,5,5],[6,6,6]]??? ghci>?map?(map?(^2))?[[1,2],[3,4,5,6],[7,8]]??? [[1,4],[9,16,25,36],[49,64]]??? ghci>?map?fst?[(1,2),(3,5),(6,3),(2,6),(2,5)]??? [1,3,6,2,2] ~~~ 你可能會發現，以上的所有代碼都可以用List Comprehension來替代。`map (+3) [1,5,3,1,6]`與`[x+3 | x <- [1,5,3,1,6]`完全等價。 filter函數取一個限制條件和一個List，返回該List中所有符合該條件的元素。它的類型聲明及實現大致如下: ~~~ filter?::?(a?->?Bool)?->?[a]?->?[a]??? filter?_?[]?=?[]??? filter?p?(x:xs)???? ????|?p?x???????=?x?:?filter?p?xs??? ????|?otherwise?=?filter?p?xs ~~~ 很簡單。只要`p x`所得的結果為真，就將這一元素加入新List，否則就無視之。幾個使用范例: ~~~ ghci>?filter?(>3)?[1,5,3,2,1,6,4,3,2,1]??? [5,6,4]??? ghci>?filter?(==3)?[1,2,3,4,5]??? [3]??? ghci>?filter?even?[1..10]??? [2,4,6,8,10]??? ghci>?let?notNull?x?=?not?(null?x)?in?filter?notNull?[[1,2,3],[],[3,4,5],[2,2],[],[],[]]??? [[1,2,3],[3,4,5],[2,2]]??? ghci>?filter?(`elem`?['a'..'z'])?"u?LaUgH?aT?mE?BeCaUsE?I?aM?diFfeRent"??? "uagameasadifeent"??? ghci>?filter?(`elem`?['A'..'Z'])?"i?lauGh?At?You?BecAuse?u?r?aLL?the?Same"??? "GAYBALLS" ~~~ 同樣，以上都可以用List Comprehension的限制條件來實現。并沒有教條規定你必須在什么情況下用`map`和`filter`還是_List Comprehension_，選擇權歸你，看誰舒服用誰就是。如果有多個限制條件，只能連著套好幾個filter或用&&等邏輯函數的組合之，這時就不如list comprehension來得爽了。還記得上一章的那個quicksort函數么? 我們用到了List Comprehension來過濾大于或小于錨的元素。換做filter也可以實現，而且更加易讀： ~~~ quicksort?::?(Ord?a)?=>?[a]?->?[a]????? quicksort?[]?=?[]????? quicksort?(x:xs)?=?????? ????let?smallerSorted?=?quicksort?(filter?(<x)?xs)? ????????biggerSorted?=?quicksort?(filter?(>x)?xs)???? ????in??smallerSorted?++?[x]?++?biggerSorted ~~~ ![](http://box.kancloud.cn/2015-07-20_55ad0ab336d51.png) map和filter是每個函數式程序員的面包黃油（呃，map和filter還是List Comprehension并不重要）。想想前面我們如何解決給定周長尋找合適直角三角形的問題的? 在命令式編程中，我們可以套上三個循環逐個測試當前的組合是否滿足條件，若滿足，就打印到屏幕或其他類似的輸出。而在函數式編程中，這行就都交給map和filter。你弄個取一參數的函數，把它交給map過一遍List，再filter之找到合適的結果。感謝haskell的惰性，即便是你多次map一個list也只會遍歷一遍該list，要找出小于100000的數中最大的3829的倍數，只需過濾結果所在的list就行了. 要找出**小于100000的3829的所有倍數**，我們應當過濾一個已知結果所在的list. ~~~ largestDivisible?::?(Integral?a)?=>?a??? largestDivisible?=?head?(filter?p?[100000,99999..])??? ????where?p?x?=?x?`mod`?3829?==?0 ~~~ 首先，取一個降序的小于100000所有數的List，然后按照限制條件過濾它。由于這個List是降序的，所以結果List中的首個元素就是最大的那個數。惰性再次行動! 由于我們只取這結果List的首個元素，所以它并不關心這List是有限還是無限的，在找到首個合適的結果處運算就停止了。接下來，我們就要**找出所有小于10000的奇數的平方和**，得先提下takeWhile函數，它取一個限制條件和List作參數，然后從頭開始遍歷這一List，并返回符合限制條件的元素。而一旦遇到不符合條件的元素，它就停止了。如果我們要取出字符串`"elephants know how to party"`中的首個單詞，可以`takeWhile (/=' ') "elephants know how to party"`，返回`"elephants"`。 okay，要求所有小于10000的奇數的平方的和，首先就用`(^2)`函數map掉這個無限的List`[1..]`。然后過濾之，只取奇數就是了。在大于10000處將它斷開，最后前面的所有元素加到一起。這一切連寫函數都不用，在ghci下直接搞定. ~~~ ghci>?sum?(takeWhile?(10000)?(filter?odd?(map?(^2)?[1..])))??? 166650 ~~~ 不錯! 先從幾個初始數據(表示所有自然數的無限list)，再map它，filter它，切它，直到它符合我們的要求，再將其加起來。這用list comprehension也是可以的，而哪種方式就全看你的個人口味. ~~~ ghci>?sum?(takeWhile?(10000)?[m?|?m??[n^2?|?n??[1..]],?odd?m])??? 166650 ~~~ 感謝haskell的惰性特質，這一切才得以實現。我們之所以可以map或filter一個無限list，是因為它的操作不會被立即執行，而是拖延一下。只有我們要求haskell交給我們sum的結果的時候，sum函數才會跟takeWhile說，它要這些數。`takeWhile`就再去要求filter和map行動起來，并在遇到大于等于10000時候停止. 下個問題與Collatz序列有關，取一個自然數，若為偶數就除以2。若為奇數就乘以3再加1。再用相同的方式處理所得的結果，得到一組數字構成的的鏈。它有個性質，無論任何以任何數字開始，最終的結果都會歸1。所以若拿13當作起始數，就可以得到這樣一個序列_13，40，20，10，5，16，8，4，2，1_。13*3+1得40，40除2得20，如是繼續，得到一個10個元素的鏈。好的，我們想知道的是: 以1到100之間的所有數作為起始數，會有多少個鏈的長度大于15? ~~~ chain?::?(Integral?a)?=>?a?->?[a]??? chain?1?=?[1]??? chain?n??? ????|?even?n?=??n:chain?(n?`div`?2)??? ????|?odd?n??=??n:chain?(n*3?+?1) ~~~ 該鏈止于1，這便是邊界條件。標準的遞歸函數: ~~~ ghci>?chain?10??? [10,5,16,8,4,2,1]??? ghci>?chain?1??? [1]??? ghci>?chain?30??? [30,15,46,23,70,35,106,53,160,80,40,20,10,5,16,8,4,2,1] ~~~ yay! 貌似工作良好。現在由這個函數來告訴我們結果: ~~~ numLongChains?::?Int??? numLongChains?=?length?(filter?isLong?(map?chain?[1..100]))??? ????where?isLong?xs?=?length?xs?>?15 ~~~ 我們把chain函數map到`[1..100]`，得到一組鏈的list，然后用個限制條件過濾長度大于15的鏈。過濾完畢后就可以得出結果list中的元素個數. > **Note**: 這函數的類型為`numLongChains :: Int`。這是由于歷史原因，`length`返回一個`Int`而非`Num`的成員類型，若要得到一個更通用的`Num a`，我們可以使用`fromInterval`函數來處理所得結果. 用map，我們可以寫出類似`map (*) [0..]`之類的代碼。如果只是為了例證柯里函數和不全調用的函數是真正的值及其原理，那就是你可以把函數傳遞或把函數裝在list中(只是你還不能將它們轉換為字符串)。迄今為止，我們還只是map單參數的函數到list，如`map (*2) [0..]`可得一組類型為`(Num a) => [a]`的list，而`map (*) [0..]`也是完全沒問題的。`*`的類型為`(Num a) -> a -> a -> a`，用單個參數調用二元函數會返回一個一元函數。如果用`*`來map 一個`[0..]`的list，就會得到一組一元函數組成的list，即`(Num a) => [a->a]`。`map (*) [0..]`所得的結果寫起來大約就是`[(*0),(*1),(*2)..]` ~~~ ghci>?let?listOfFuns?=?map?(*)?[0..]??? ghci>?(listOfFuns?!!?4)?5??? 20 ~~~ 取所得list的第四個元素可得一函數，與`(*4)`等價。然后用`5`調用它，與`(* 4) 5`或`4*5`都是等價的. ## lambda ![](http://box.kancloud.cn/2015-07-20_55ad0ab43c8b8.png) lambda就是匿名函數。有些時候我們需要傳給高階函數一個函數，而這函數我們只會用這一次，這就弄個特定功能的lambda。編寫lambda，就寫個`\`（因為它看起來像是希臘字母的lambda--如果你斜視的厲害），后面是用空格分隔的參數，`->`后面就是函數體。通常我們都是用括號將其括起，要不然它就會占據整個右邊部分。向上5英寸左右，你會看到我們在`numLongChain`函數中用where語句聲明了個`isLong`函數傳遞給了filter。好的，用lambda代替它。 ~~~ numLongChains?::?Int??? numLongChains?=?length?(filter?(\xs?->?length?xs?>?15)?(map?chain?[1..100])) ~~~ ![](http://box.kancloud.cn/2015-07-20_55ad0aba60679.png) lambda是個表達式，因此我們可以任意傳遞。表達式`(\xs -> length xs > 15)`返回一個函數，它可以告訴我們一個list的長度是否大于15。不熟悉柯里函數與不全調用的人們往往會寫出很多lambda，而實際上大部分都是沒必要的。例如，表達式`map (+3) [1,6,3,2]`與`map (\x -> x+3) [1,6,3,2]`等價，`(+3)`和`(\x -> x+3)`都是給一個數加上3。不用說，在這種情況下不用lambda要清爽的多。和普通函數一樣，lambda也可以取多個參數。 ~~~ ghci>?zipWith?(\a?b?->?(a?*?30?+?3)?/?b)?[5,4,3,2,1]?[1,2,3,4,5]??? [153.0,61.5,31.0,15.75,6.6] ~~~ 同普通函數一樣，你也可以在lambda中使用模式匹配，只是你無法為一個參數設置多個模式，如`[]`和`(x:xs)`。lambda的模式匹配若失敗，就會引發一個運行時錯誤，所以慎用！ ~~~ ghci>?map?(\(a,b)?->?a?+?b)?[(1,2),(3,5),(6,3),(2,6),(2,5)]??? [3,8,9,8,7] ~~~ 一般情況下，lambda都是括在括號中，除非我們想要后面的整個語句都作為lambda的函數體。很有趣，由于有柯里化，如下的兩段是等價的： ~~~ addThree?::?(Num?a)?=>?a?->?a?->?a?->?a??? addThree?x?y?z?=?x?+?y?+?z ~~~ ~~~ addThree?::?(Num?a)?=>?a?->?a?->?a?->?a??? addThree?=?\x?->?\y?->?\z?->?x?+?y?+?z ~~~ 這樣的函數聲明與函數體中都有`->`，這一來類型聲明的寫法就很明白了。當然第一段代碼更易讀，不過第二個函數使得柯里化更容易理解。有些時候用這種語句寫還是挺酷的，我覺得這應該是最易讀的flip函數實現了： ~~~ flip'?::?(a?->?b?->?c)?->?b?->?a?->?c??? flip'?f?=?\x?y?->?f?y?x ~~~ 盡管這與`flip' f x y = f y x`等價，但它可以更明白地表示出它會產生一個新的函數。flip常用來處理一個函數，再將返回的新函數傳遞給map或filter。所以如此使用lambda可以更明確地表現出返回值是個函數，可以用來傳遞給其他函數作參數。 ## 折疊紙鶴 ![](http://box.kancloud.cn/2015-07-20_55ad0abd1bdb7.png) 回到當初我們學習遞歸的情景。我們會發現處理list的許多函數都有固定的模式，通常我們會將邊界條件設置為空list，再引入(x:xs)模式，對單個元素和余下的list做些事情。這一模式是如此常見，因此haskell引入了一組函數來使之簡化，也就是fold。它們與map有點像，只是它們返回的是單個值。一個fold取一個二元函數，一個初始值（我喜歡管它叫累加值）和一個需要fold（折疊）的list。這個二元函數有兩個參數，即累加值和list的首項（或尾項），返回值是新的累加值。然后，以新的累加值和新的list首項調用該函數，如是繼續。到list遍歷完畢時，只剩下一個累加值，也就是最終的結果。首先看下foldl函數，也叫做左折疊。它從list的左端開始折疊，用初始值和list的頭部調用這二元函數，得一新的累加值，并用新的累加值與list的下一個元素調用二元函數。如是繼續。我們再實現下sum，這次用fold替代那復雜的遞歸： ~~~ sum'?::?(Num?a)?=>?[a]?->?a??? sum'?xs?=?foldl?(\acc?x?->?acc?+?x)?0?xs ~~~ 測試下，一二三～ ~~~ ghci>?sum'?[3,5,2,1]??? 11 ~~~ ![](http://box.kancloud.cn/2015-07-20_55ad0ad659f70.png) 我們深入看下fold的執行過程：`\acc x-> acc + x`是個二元函數，`0`是初始值，`xs`是待折疊的list。一開始，累加值為`0`，當前項為`3`，調用二元函數`0+3`得`3`，作新的累加值。接著來，累加值為`3`，當前項為`5`，得新累加值`8`。再往后，累加值為`8`，當前項為`2`，得新累加值`10`。最后累加值為`10`，當前項為`1`，得`11`。恭喜，你完成了一次折疊(fold)！左邊的這個圖表示了折疊的執行過程，一步又一步（一天又一天!）。淺棕色的數字都是累加值，你可以從中看出list是如何從左端一點點加到累加值上的。唔對對對！如果我們考慮到函數的柯里化，可以寫出更簡單的實現： ~~~ sum'?::?(Num?a)?=>?[a]?->?a??? sum'?=?foldl?(+)?0 ~~~ 這個lambda函數`(\acc x -> acc + x )`與(+)等價。我們可以把xs等一應參數省略掉，反正調用`foldl (+) 0`會返回一個取list作參數的函數。通常，如果你的函數類似`foo a = bar b a`，大可改為`foo = bar b`。有柯里化嘛。呼呼，進入右折疊前我們再實現個用到左折疊的函數。大家肯定都知道elem是檢查某元素是否屬于某list的函數吧，我就不再提了（唔，剛提了）。用左折疊實現它: ~~~ elem'?::?(Eq?a)?=>?a?->?[a]?->?Bool??? elem'?y?ys?=?foldl?(\acc?x?->?if?x?==?y?then?True?else?acc)?False?ys ~~~ 好好好，這里我們有什么？起始值與累加值都是布爾值。在處理fold時，累加值與最終結果的類型總是相同的。如果你不知道怎樣對待起始值，那我告訴你，我們先假設它不存在，以False開始。我們要是fold一個空list，結果就是False。然后我們檢查當前元素是否為我們尋找的，如果是，就令累加值為True，如果否，就保留原值不變。若False，及表明當前元素不是。若True，就表明已經找到了。右折疊foldr的行為與左折疊相似，只是累加值是從list的右邊開始。同樣，左折疊的二元函數取累加值作首個參數，當前值為第二個參數（即`\acc x -> ...`），而右折疊的二元函數參數的順序正好相反（即`\x acc -> ...`）。這倒也正常，畢竟是從右端開始折疊。累加值可以是任何類型，可以是數值，布爾值，甚至一個新的list。我們可以用右fold實現map函數，累加值就是個list。將map處理過的元素一個一個連到一起。很容易想到，起始值就是空list。 ~~~ map'?::?(a?->?b)?->?[a]?->?[b]??? map'?f?xs?=?foldr?(\x?acc?->?f?x?:?acc)?[]?xs ~~~ 如果我們用`(+3)`來映射`[1,2,3]`，它就會先到達list的右端，我們取最后那個元素，也就是`3`來調用`(+3)`，得`6`。追加`(:)`到累加值上，`6:[]`得`[6]`并成為新的累加值。用`2`調用`(+3)`，得`5`，追加到累加值，于是累加值成了`[5,6]`。再對`1`調用`(+3)`，并將結果4追加到累加值，最終得結果`[4,5,6]`。當然，我們也完全可以用左折疊來實現它，`map' f xs = foldl (\acc x -> acc ++ [f x]) [] xs`就行了。不過問題是，使用`(++)`往list后面追加元素的效率要比使用`(:)`低得多。所以在生成新list的時候人們一般都是使用右折疊。 ![](http://box.kancloud.cn/2015-07-20_55ad0adbf25dc.png) 反轉一個list，既也可以通過右折疊，也可以通過左折疊。有時甚至不需要管它們的分別，如sum函數的左右折疊實現都是十分相似。不過有個大的不同，那就是右折疊可以處理無限長度的數據結構，而左折疊不可以。將無限list從中斷開執行左折疊是可以的，不過若是向右，就永遠到不了頭了。 **所有遍歷list中元素并據此返回一個值的操作都可以交給fold實現**。無論何時需要遍歷list并返回某值，都可以嘗試下fold。因此，fold的地位可以說與map和filter并駕齊驅，同為函數式編程中最常用的函數之一。 foldl1與foldr1的行為與`foldl`和`foldr`相似，只是你無需明確提供初始值。他們假定list的首個（或末尾）元素作為起始值，并從旁邊的元素開始折疊。這一來，`sum`函數大可這樣實現：`sum = foldl1 (+)`。這里待折疊的list中至少要有一個元素，若使用空list就會產生一個運行時錯誤。不過foldl和foldr與空list相處的就很好。所以在使用fold前，應該先想下它會不會遇到空list，如果不會遇到，大可放心使用`foldr1`和`foldl1`。為了體會fold的威力，我們就用它實現幾個庫函數： ~~~ maximum'?::?(Ord?a)?=>?[a]?->?a??? maximum'?=?foldr1?(\x?acc?->?if?x?>?acc?then?x?else?acc)??? reverse'?::?[a]?->?[a]??? reverse'?=?foldl?(\acc?x?->?x?:?acc)?[]??? product'?::?(Num?a)?=>?[a]?->?a??? product'?=?foldr1?(*)??? filter'?::?(a?->?Bool)?->?[a]?->?[a]??? filter'?p?=?foldr?(\x?acc?->?if?p?x?then?x?:?acc?else?acc)?[]??? head'?::?[a]?->?a??? head'?=?foldr1?(\x?_?->?x)??? last'?::?[a]?->?a??? last'?=?foldl1?(\_?x?->?x) ~~~ 僅靠模式匹配就可以實現head函數和last函數，而且效率也很高。這里只是為了演示，用fold的實現方法。我覺得我們這個reverse'定義的相當聰明，用一個空list做初始值，并向左展開list，從左追加到累加值，最后得到一個反轉的新list。`\acc x -> x : acc`有點像`:`函數，只是參數順序相反。所以我們可以改成`foldl (flip (:)) []`。有個理解折疊的思路：假設我們有個二元函數f，起始值z，如果從右折疊`[3,4,5,6]`，實際上執行的就是`f 3 (f 4 (f 5 (f 6 z)))`。f會被list的尾項和累加值調用，所得的結果會作為新的累加值傳入下一個調用。假設f是`(+)`，起始值z是`0`，那么就是`3 + (4 + (5 + (6 + 0)))`，或等價的前綴形式：`(+) 3 ((+) 4 ((+) 5 ((+) 6 0)))`。相似，左折疊一個list，以g為二元函數，z為累加值，它就與`g (g (g (g z 3) 4) 5) 6`等價。如果用`flip (:)`作二元函數，`[]`為累加值（看得出，我們是要反轉一個list），這就與`flip (:) (flip (:) (flip (:) (flip (:) [] 3) 4) 5) 6`等價。顯而易見，執行該表達式的結果為`[6,5,4,3]`。 scanl和scanr與`foldl`和`foldr`相似，只是它們會記錄下累加值的所有狀態到一個list。也有scanl1和scanr1。 ~~~ ghci>?scanl?(+)?0?[3,5,2,1]??? [0,3,8,10,11]??? ghci>?scanr?(+)?0?[3,5,2,1]??? [11,8,3,1,0]??? ghci>?scanl1?(\acc?x?->?if?x?>?acc?then?x?else?acc)?[3,4,5,3,7,9,2,1]??? [3,4,5,5,7,9,9,9]??? ghci>?scanl?(flip?(:))?[]?[3,2,1]??? [[],[3],[2,3],[1,2,3]] ~~~ 當使用scanl時，最終結果就是list的最后一個元素。而在scanr中則是第一個。 ~~~ sqrtSums?::?Int??? sqrtSums?=?length?(takeWhile?(1000)?(scanl1?(+)?(map?sqrt?[1..])))?+?1 ~~~ ~~~ ghci>?sqrtSums??? 131??? ghci>?sum?(map?sqrt?[1..131])??? 1005.0942035344083??? ghci>?sum?(map?sqrt?[1..130])??? 993.6486803921487 ~~~ `scan`可以用來跟蹤fold函數的執行過程。想想這個問題，**取所有自然數的平方根的和，尋找在何處超過1000**？先`map sqrt [1..]`，然后用個fold來求它們的和。但在這里我們想知道求和的過程，所以使用`scan`，`scan`完畢時就可以得到小于1000的所有和。所得結果list的第一個元素為1，第二個就是1+根2，第三個就是1+根2+根3。若有x個和小于1000，那結果就是x+1。 ## 有$的函數調用好的，接下來看看$函數。它也叫作**函數調用符**。先看下它的定義： ~~~ ($)?::?(a?->?b)?->?a?->?b??? f?$?x?=?f?x ~~~ ![](http://box.kancloud.cn/2015-07-20_55ad0ae04677f.png) 什么鬼東西？這沒啥意義的操作符？它只是個函數調用符罷了？好吧，不全是，但差不多。普通的函數調用符有最高的優先級，而`$`的優先級則最低。用空格的函數調用符是左結合的，如f a b c與((f a) b) c等價，而$則是右結合的。聽著不錯。但有什么用？它可以減少我們代碼中括號的數目。試想有這個表達式：`sum (map sqrt [1..130])`。由于低優先級的$，我們可以將其改為`sum $ map sqrt [1..130]`，可以省敲不少鍵！`sqrt 3 + 4 + 9`會怎樣？這會得到9，4和根3的和。若要取`(3+4+9)`的平方根，就得`sqrt (3+4+9)`或用`$`：`sqrt $ 3+4+9`。因為`$`有最低的優先級，所以你可以把$看作是在右面寫一對括號的等價形式。 `sum (filter (> 10) (map (*2) [2..10]))`該如何？嗯，$是右結合，`f (g (z x))`與`f $ g $ z x`等價。所以我么可以將`sum (filter (> 10) (map (*2) [2..10])`重寫為`sum $ filter (> 10) $ map (*2) [2..10]`。除了減少括號外，$還可以將數據作為函數使用。例如映射一個函數調用符到一組函數組成的list： ~~~ ghci>?map?($?3)?[(4+),(10*),(^2),sqrt]??? [7.0,30.0,9.0,1.7320508075688772] ~~~ ## 函數組合在數學中，函數組合是這樣定義的：![](http://box.kancloud.cn/2015-07-20_55ad0ae196d15.png)，表示組合兩個函數成為一個函數。以x調用這一函數，就與用x調用g再用所得的結果調用f等價。 haskell中的函數組合與之很像，即.函數。其定義為： ~~~ (.)?::?(b?->?c)?->?(a?->?b)?->?a?->?c??? f?.?g?=?\x?->?f?(g?x) ~~~ ![](http://box.kancloud.cn/2015-07-20_55ad0ae4126a7.png) 注意下這類型聲明，`f`的參數類型必須與`g`的返回類型相同。所以得到的組合函數的參數類型與`g`相同，返回類型與`f`相同。表達式`negate . (*3)`返回一個求一數字乘以3后的負數的函數。函數組合的用處之一就是生成新函數，并傳遞給其它函數。當然我們可以用lambda實現，但大多數情況下，使用函數組合無疑更直白。假設我們有一組由數字組成的list，要將其全部轉為負數，很容易就想到應先取其絕對值，再取負數，像這樣： ~~~ ghci>?map?(\x?->?negate?(abs?x))?[5,-3,-6,7,-3,2,-19,24]??? [-5,-3,-6,-7,-3,-2,-19,-24] ~~~ 注意下這個lambda與那函數組合是多么的相像。用函數組合，我們可以將代碼改為： ~~~ ghci>?map?(negate?.?abs)?[5,-3,-6,7,-3,2,-19,24]??? [-5,-3,-6,-7,-3,-2,-19,-24] ~~~ 漂亮！函數組合是右結合的，我們同時組合多個函數。表達式`f (g (z x))`與`(f . g . z) x`等價。按照這個思路，我們可以將 ~~~ ghci>?map?(\xs?->?negate?(sum?(tail?xs)))?[[1..5],[3..6],[1..7]]??? [-14,-15,-27] ~~~ 改為： ~~~ ghci>?map?(negate?.?sum?.?tail)?[[1..5],[3..6],[1..7]]??? [-14,-15,-27] ~~~ 不過含多個參數的函數該怎么辦？好，我們可以使用不全調用使每個函數都只剩下一個參數。`sum (replicate 5 (max 6.7 8.9))`可以重寫為`(sum . replicate 5 . max 6.7) 8.9`或`sum . replicate 5 . max 6.7 $ 8.9`。在這里會產生一個函數，它取與`max 6.7`同樣的參數，并使用結果調用`replicate 5`再用`sum`求和。最后用`8.9`調用該函數。不過一般你可以這么讀，用8.9調用`max 6.7`，然后使它`replicate 5`，再sum之。如果你打算用函數組合來替掉那堆括號，可以先在最靠近參數的函數后面加一個`$`，接著就用`.`組合其所有函數調用，而不用管最后那個參數。如果有這樣一段代碼：`replicate 100 (product (map (*3) (zipWith max [1,2,3,4,5] [4,5,6,7,8])))`，可以改為：`replicate 100 . product . map (*3) . zipWith max [1,2,3,4,5] $ [4,5,6,7,8]`。如果表達式以3個括號結尾，就表示你可以將其修改為函數組合的形式。函數組合的另一用途就是定義point free style（也稱作pointless style）的函數。就拿我們之前寫的函數作例子： ~~~ sum'?::?(Num?a)?=>?[a]?->?a?????? sum'?xs?=?foldl?(+)?0?xs ~~~ 等號的兩端都有個xs。由于有柯里化（Currying），我們可以省掉兩端的xs。`foldl (+) 0`返回的就是一個取一list作參數的函數，我們把它修改為`sum' = foldl (+) 0`，這就是point free style。下面這個函數又該如何改成point free style呢？ ~~~ fn?x?=?ceiling?(negate?(tan?(cos?(max?50?x)))) ~~~ 像剛才那樣簡單去掉兩端的x是不行的，函數體中x的右邊還有括號。cos (max 50)是有錯誤的，你不能求一個函數的余弦。我們的解決方法就是，使用函數組合。 ~~~ fn?=?ceiling?.?negate?.?tan?.?cos?.?max?50 ~~~ 漂亮！point free style會令你去思考函數的組合方式，而非數據的傳遞方式，更加簡潔直白。你可以將一組簡單的函數組合在一起，使之形成一個復雜的函數。不過函數若過于復雜，再使用point free style往往會適得其反，因此構造較長的函數組合鏈是不被鼓勵的（雖然我本人熱衷于函數組合）。更好的解決方法，就是使用let語句給中間的運算結果綁定一個名字，或者說把問題分解成幾個小問題再組合到一起。這樣一來我們代碼的讀者就可以輕松些，不必要糾結那巨長的函數組合鏈了。在map和filter那節中，我們求了小于10000的所有奇數的平方的和。如下就是將其置于一個函數中的樣子： ~~~ oddSquareSum?::?Integer??? oddSquareSum?=?sum?(takeWhile?(10000)?(filter?odd?(map?(^2)?[1..]))) ~~~ 身為函數組合狂人，我可能會這么寫： ~~~ oddSquareSum?::?Integer??? oddSquareSum?=?sum?.?takeWhile?(10000)?.?filter?odd?.?map?(^2)?$?[1..] ~~~ 不過若是給別人看，我可能就這么寫了： ~~~ oddSquareSum?::?Integer??? oddSquareSum?=???? ????let?oddSquares?=?filter?odd?$?map?(^2)?[1..]??? ????????belowLimit?=?takeWhile?(10000)?oddSquares??? ????in??sum?belowLimit ~~~ 這段代碼可贏不了代碼花樣大賽，不過我們的讀者可能會覺得它比函數組合鏈更好看。