那一年讀過的技術經典書 · 這些年，我們讀過的技術經典圖書

轉載請注明：[http://blog.csdn.net/xinzhangyanxiang/article/details/10199757](http://blog.csdn.net/xinzhangyanxiang/article/details/10199757) 大學剛畢業，總結起來讀過的書并不算多，而且主要集中在大四的時期讀的，在此把經典統一總結一遍。先總結機器學習方面的吧，對這方面比較感興趣，讀過的書也比較多。 **《數學之美》**；作者吳軍大家都很熟悉。這本書主要的作用是引起了我對機器學習和自然語言處理的興趣。里面以極為通俗的語言講述了數學在這兩個領域的應用。 **《ProgrammingCollective Intelligence》（中譯本《集體智慧編程》）**；作者Toby Segaran也是《BeautifulData : The Stories Behind Elegant Data Solutions》（《數據之美：解密優雅數據解決方案背后的故事》）的作者。這本書最大的優勢就是里面沒有理論推導和復雜的數學公式，是很不錯的入門書。目前中文版已經脫銷，對于有志于這個領域的人來說，英文的pdf是個不錯的選擇，因為后面有很多經典書的翻譯都較差，只能看英文版，不如從這個入手。還有，這本書適合于快速看完，因為據評論，看完一些經典的帶有數學推導的書后會發現這本書什么都沒講，只是舉了很多例子而已。 **《Algorithms of theIntelligent Web》（中譯本《智能web算法》）**；作者Haralambos Marmanis、Dmitry Babenko。這本書中的公式比《集體智慧編程》要略多一點，里面的例子多是互聯網上的應用，看名字就知道。不足的地方在于里面的配套代碼是BeanShell而不是python或其他。總起來說，這本書還是適合初學者，與上一本一樣需要快速讀完，如果讀完上一本的話，這一本可以不必細看代碼，了解算法主要思想就行了。 **《統計學習方法》；**作者李航，是國內機器學習領域的幾個大家之一，曾在MSRA任高級研究員，現在華為諾亞方舟實驗室。書中寫了十個算法，每個算法的介紹都很干脆，直接上公式，是徹頭徹尾的“干貨書”。每章末尾的參考文獻也方便了想深入理解算法的童鞋直接查到經典論文；本書可以與上面兩本書互為輔助閱讀。 **《Machine Learning》（《機器學習》）；**作者TomMitchell是CMU的大師，有機器學習和半監督學習的網絡課程視頻。這本書是領域內翻譯的較好的書籍，講述的算法也比《統計學習方法》的范圍要大很多。據評論這本書主要在于啟發，講述公式為什么成立而不是推導；不足的地方在于出版年限較早，時效性不如PRML。但有些基礎的經典還是不會過時的，所以這本書現在幾乎是機器學習的必讀書目。 **《Mining of MassiveDatasets》（《大數據》）；**作者Anand Rajaraman、Jeffrey David Ullman，Anand是Stanford的PhD。這本書介紹了很多算法，也介紹了這些算法在數據規模比較大的時候的變形。但是限于篇幅，每種算法都沒有展開講的感覺，如果想深入了解需要查其他的資料，不過這樣的話對算法進行了解也足夠了。還有一點不足的地方就是本書原文和翻譯都有許多錯誤，勘誤表比較長，讀者要用心了。 **《Data Mining:Practical Machine Learning Tools and Techniques》（《數據挖掘：實用機器學習技術》）；**作者IanH. Witten 、Eibe Frank是weka的作者、新西蘭懷卡托大學教授。他們的《ManagingGigabytes》也是信息檢索方面的經典書籍。這本書最大的特點是對weka的使用進行了介紹，但是其理論部分太單薄，作為入門書籍還可，但是，經典的入門書籍如《集體智慧編程》、《智能web算法》已經很經典，學習的話不宜讀太多的入門書籍，建議只看一些上述兩本書沒講到的算法。上面大多都是一些機器學習入門級的書籍，想要在這個領域深入下去，還需要深入的閱讀一些經典書籍。看了很多推薦大牛推薦的書單，這里總結一下最經典的幾本書吧。 **《PatternClassification》（《模式分類》第二版）；**作者Richard O. Duda、Peter E. Hart、David。模式識別的奠基之作，但對最近呈主導地位的較好的方法SVM、Boosting方法沒有介紹，被評“掛一漏萬之嫌”。 **《Pattern RecognitionAnd Machine Learning》；**作者Christopher M. Bishop；簡稱**PRML**，側重于概率模型，是貝葉斯方法的扛鼎之作，據評“具有強烈的工程氣息，可以配合stanford 大學 Andrew Ng 教授的 Machine Learning 視頻教程一起來學，效果翻倍。” **《The Elements ofStatistical Learning : Data Mining, Inference, and Prediction》，（《統計學習基礎：數據挖掘、推理與預測》第二版）；**作者RobertTibshirani、Trevor Hastie、Jerome Friedman。“這本書的作者是Boosting方法最活躍的幾個研究人員，發明的Gradient Boosting提出了理解Boosting方法的新角度，極大擴展了Boosting方法的應用范圍。這本書對當前最為流行的方法有比較全面深入的介紹，對工程人員參考價值也許要更大一點。另一方面，它不僅總結了已經成熟了的一些技術，而且對尚在發展中的一些議題也有簡明扼要的論述。讓讀者充分體會到機器學習是一個仍然非常活躍的研究領域，應該會讓學術研究人員也有常讀常新的感受。” **《Data Mining：ConceptsandTechniques》，（《數據挖掘：概念與技術》第三版）；**作者（美）Jiawei Han[8]、（加）Micheline Kamber、（加）Jian Pei，其中第一作者是華裔。本書毫無疑問是數據挖掘方面的的經典之作，不過翻譯版總是被噴，沒辦法，大部分翻譯過來的書籍都被噴，想要不吃別人嚼過的東西，就好好學習英文吧。以上內容出自我的另一篇博客[機器學習經典書籍總結](http://blog.csdn.net/xinzhangyanxiang/article/details/9069045)。機器學習的書籍大概就這么多，讀過的其他經典書有如下幾本。 **《Computer Systems AProgrammer's perspective》（《深入理解計算機系統（原書第2版）》）**。簡稱**CSAPP**，是CMU的CS系關于計算機導論方面的教材，最好在對C/C++有一定了解之后讀，這本書講述的內容解決了程序員該對硬件了解到什么程度的問題。這本書翻譯的也不錯，講述的內容按章節分的比較清楚，不要被它的大部頭嚇到，一章一章的分而治之即可。 **《暗時間》，**作者劉未鵬，現就職于微軟亞洲研究院創新工程中心，是C++方面的大牛，但博學多識，讀書多知識面廣。嚴格來說，這本書并不算是技術類的，因為它講技術的篇幅并不大，而且開篇講了很多心理學的知識。在我看來，這本書心理學的部分可以看做是勵志論，教人如何在奮斗的路上堅持下去；中間部分可以看做是方法論，教人如何學習，如何進步；最后有一些作者對統計學習的解析，很是精辟，用真知灼見稱之不為過。 **《Hadoop實戰》**，作者陸嘉恒，人大的教授。這本書對hadoop架構上的各個部分做了詳細的介紹，適合hadoop入門使用。 **《七周七語言》**，作者BruceA.Tate是RapidRed公司總裁，譯者戴瑋。這本書講述了很多編程范式，顛覆了我的很多觀念。適合于拓展視野，如果真的想學習其中的某一種語言的話，本書介紹的略少，因為它只是把該語言的特性及優劣簡要的介紹了一下而已。 **《設計模式：可復用面向對象軟件的基礎》**，作者Erich Gamma / Richard Helm / Ralph Johnson / John Vlissides。也被稱為四人幫（GOF）。四個人都是cs方面的大牛，以第一人ErichGamma為例，他是JUnit軟件測試平臺的作者之一，還領導了JDT的設計。該書總結了23種設計模式，都是軟件開發上經常用的經典，但設計模式這種東西應該基于深刻理解的基礎上才可使用，故不適合初學者，建議有較長時間編程實戰的童鞋讀起。本小菜大二讀過一遍，但頗感艱難，亦難于實用。因而想有時間時重讀經典。下面再介紹兩本正在利用暗時間零碎讀的經典書。 **《UNIX環境高級編程》，**作者是W.RichardStevens，備受贊譽的技術作家，生前著有多種經典的傳世之作，包括《UNIX網絡編程》（兩卷本）、《TCP/IP詳解》（三卷本）和本書第1版。本書被譽為Unix編程方面的圣經，可見其地位與經典不容置疑。 **《C程序設計語言》，**本書原著即為C語言的設計者之一Dennis M.Ritchie和著名計算機科學家Brian W.Kernighan合著的一本介紹C語言的權威經典著作。我們現在見到的大量論述C語言程序設計的教材和專著均以此書為藍本。本書很簡潔，看了開頭發現例子竟然都是Linux下的庫函數的實現，對比而言，浩強兄那本則略顯啰嗦與細節化了。 **《具體數學：計算機科學基礎，第二版》，**（**ConcreteMathematics：A Foundation for Computer Science, Second Edition）**，作者Ronald L.Graham（葛立恒），Donald E. Knuth（高德納），Oren Patashnik。這幾位作者都是cs方面天一樣的人物，以高德納為例，是算法與程序設計的先驅，Tex和MetaFont的作者，TAOCP（The Art of Computer Science）的作者，還有以其名字命名的獎專門頒給對CS貢獻大的人，名望直追圖靈。這本書主要內容包括計數組合數學（enumerative combinatorics）和分析組合數學（analyticcombinatorics），還有一些概率論和數論的內容，該書的特點在于強調演算，忽略數學定理和抽象的數學體系。謂之具體可以說是實至名歸啊。這一年來讀過的書和未來近期的打算要讀的經典書就這么多。按照《暗時間》中的方法論，讀書一定要讀經典，而且要常總結。按照這種方法，發現自己不僅僅是讀了很多書，而且有很多的收獲。希望本文對讀者有幫助，如果有經典書歡迎推薦。