
*****
你是不是覺得數據結構和算法,跟操作系統、計算機網絡一樣,是脫離實際工作的知識?可能除了面試,這輩子也用不著?
<br>盡管計算機相關專業的同學在大學都學過這門課程,但是據我了解,很多程序員對數據結構和算法依舊一竅不通。還有一些人也只聽說過數組、鏈表、快排這些最最基本的數據結構和算法,稍微復雜一點的就完全沒概念。
<br>當然,也有很多同學說,自己實際工作中根本用不到數據結構和算法。所以,就算不懂這塊知識,只要代碼、開發框架用得熟練,照樣可以把代碼寫得'飛'起來。事實真的是這樣嗎?
<br>今天我們就來詳細聊一聊,為什么要學習數據結構和算法。
<br>想要通關大廠面試,千萬別讓數據結構和算法拖了后腿
很多大公司,比如BAT、Google、Facebook,面試的時候都喜歡考算法、讓人現場寫代碼。有些人雖然技術不錯,但每次去面試都會'跪'在算法上,很是可惜。那你有沒有想過,為什么這些大公司都喜歡考算法呢?
<br>校招的時候,參加面試的學生通常沒有實際項目經驗,公司只能考察他們的基礎知識是否牢固。社招就更不用說了,越是厲害的公司,越是注重考察數據結構與算法這類基礎知識。相比短期能力, 他們更看中你的長期潛力。
<br>你可能要說了,我不懂數據結構與算法,照樣找到了好工作啊。那我是不是就不用學數據結構和算法呢?當然不是,你別忘了,我們學任何知識都是為了“用”的,是為了解決實際工作問題的,學習數據結構和算法自然也不例外。
<br>業務開發工程師,你真的愿意做一輩子 CRUD boy 嗎?
如果你是一名業務開發工程師,你可能要說,我整天就是做數據庫 CRUD(增刪改查),哪里用得到數據結構和算法啊?
<br>是的,對于大部分業務開發來說,我們平時可能更多的是利用已經封裝好的現成的接口、類庫來堆砌、翻譯業務邏輯,很少需要自己實現數據結構和算法。但是,不需要自己實現,并不代表什么都不需要了解。
<br>如果不知道這些類庫背后的原理,不懂得時間、空間復雜度分析,你如何能用好、用對它們?存儲某個業務數據的時候,你如何知道應該用 ArrayList,還是 Linked List 呢?調用了某個函數之后,你又該如何評估代碼的性能和資源的消耗呢?
<br>作為業務開發,我們會用到各種框架、中間件和底層系統,比如 Spring、RPC 框架、消息中間件、Redis 等等。在這些基礎框架中,一般都揉和了很多基礎數據結構和算法的設計思想。
<br>比如,我們常用的 Key-Value 數據庫 Redis 中,里面的有序集合是用什么數據結構來實現的呢?為什么要用跳表來實現呢?為什么不用二叉樹呢?
<br>如果你能弄明白這些底層原理,你就能更好地使用它們。即便出現問題,也很容易就能定位。因此,掌握數據結構和算法,不管對于閱讀框架源碼,還是理解其背后的設計思想,都是非常有用的。
<br>在平時的工作中,數據結構和算法的應用到處可見。我來舉一個你非常熟悉的例子:如何實時地統計業務接口的 99% 響應時間?
你可能最先想到,每次查詢時,從小到大排序所有的響應時間,如果總共有 1200 個數據,那第1188 個數據就是 99% 的響應時間。很顯然,每次用這個方法查詢的話都要排序,效率是非常低的。但是,如果你知道“堆”這個數據結構,用兩個堆可以非常高效地解決這個問題。
<br>基礎架構研發工程師,寫出達到開源水平的框架才是你的目標!
現在互聯網上的技術文章、架構分享、開源項目滿天飛,照貓畫虎做一套基礎框架并不難。我就拿RPC框架舉例。
<br>不同的公司、不同的人做出的 RPC 框架,架構設計思路都差不多,最后實現的功能也都差不多。但是有的人做出來的框架,Bug 很多、性能一般、擴展性也不好,只能在自己公司僅有的幾個項目里面用一下。而有的人做的框架可以開源到 GitHub 上給很多人用,甚至被 Apache 收錄。為什么會有這么大的差距呢?
<br>我覺得,高手之間的競爭其實就在細節。這些細節包括:你用的算法是不是夠優化,數據存取的效率是不是夠高,內存是不是夠節省等等。這些累積起來,決定了一個框架是不是優秀。所以,如果你還不懂數據結構和算法,沒聽說過大 O 復雜度分析,不知道怎么分析代碼的時間復雜度和空間復雜度,那肯定說不過去了,趕緊來補一補吧!
<br>對編程還有追求?不想被行業淘汰?那就不要只會寫湊合能用的代碼!
何為編程能力強?是代碼的可讀性好、健壯?還是擴展性好?我覺得沒法列,也列不全。但是,在我看來,性能好壞起碼是其中一個非常重要的評判標準。但是,如果你連代碼的時間復雜度、空間復雜度都不知道怎么分析,怎么寫出高性能的代碼呢?
<br>你可能會說,我在小公司工作,用戶量很少,需要處理的數據量也很少,開發中不需要考慮那么多性能的問題,完成功能就可以,用什么數據結構和算法,差別根本不大。但是你真的想“十年如一 日”地做一樣的工作嗎?
經常有人說,程序員 35 歲之后很容易陷入瓶頸,被行業淘汰,我覺得原因其實就在此。有的人寫代碼的時候,從來都不考慮非功能性的需求,只是完成功能,湊合能用就好;做事情的時候,也從來沒有長遠規劃,只把眼前事情做好就滿足了。
<br>我曾經面試過很多大齡候選人,簡歷能寫十幾頁,經歷的項目有幾十個,但是細看下來,每個項目都是重復地堆砌業務邏輯而已,完全沒有難度遞進,看不出有能力提升。久而久之,十年的積累可能跟一年的積累沒有任何區別。這樣的人,怎么不會被行業淘汰呢?
<br>如果你在一家成熟的公司,或者 BAT 這樣的大公司,面對的是千萬級甚至億級的用戶,開發的是TB、PB 級別數據的處理系統。性能幾乎是開發過程中時刻都要考慮的問題。一個簡單的ArrayList、Linked List 的選擇問題,就可能會產生成千上萬倍的性能差別。這個時候,數據結構和算法的意義就完全凸顯出來了。
<br>其實,我覺得,數據結構和算法這個東西,如果你不去學,可能真的這輩子都用不到,也感受不到它的好。但是一旦掌握,你就會常常被它的強大威力所折服。之前你可能需要費很大勁兒來優化的代碼,需要花很多心思來設計的架構,用了數據結構和算法之后,很容易就可以解決了。