# 利用 Python 進行數據分析 · 第 2 版

> 譯者:[SeanCheney](https://github.com/iamseancheney)
>
> 歡迎任何人參與和完善:一個人可以走的很快,但是一群人卻可以走的更遠。
+ [在線閱讀](https://pyda.apachecn.org)
+ [ApacheCN 機器學習交流群 629470233](http://shang.qq.com/wpa/qunwpa?idkey=30e5f1123a79867570f665aa3a483ca404b1c3f77737bc01ec520ed5f078ddef)
+ [ApacheCN 學習資源](http://www.apachecn.org/)
+ [Sklearn 與 TensorFlow 機器學習實用指南](https://github.com/it-ebooks/hands-on-ml-2e-zh)
‍
+ [在線閱讀](https://www.gitbook.com/book/wizardforcel/pyda-2e/details)
+ [PDF格式](https://www.gitbook.com/download/pdf/book/wizardforcel/pyda-2e)
+ [EPUB格式](https://www.gitbook.com/download/epub/book/wizardforcel/pyda-2e)
+ [MOBI格式](https://www.gitbook.com/download/mobi/book/wizardforcel/pyda-2e)
+ [代碼倉庫](https://github.com/apachecn/pyda-2e-zh)
下載本書代碼(本書GitHub地址):[https://github.com/wesm/pydata-book](https://github.com/wesm/pydata-book) (建議把代碼下載下來之后,安裝好Anaconda 3.6,在目錄文件夾中用Jupyter notebook打開)
本書是2017年10月20號正式出版的,和第1版的不同之處有:
* 包括Python教程內的所有代碼升級為Python 3.6(第1版使用的是Python 2.7)
* 更新了Anaconda和其它包的Python安裝方法
* 更新了Pandas為2017最新版
* 新增了一章,關于更高級的Pandas工具,外加一些tips
* 簡要介紹了使用StatsModels和scikit-learn
對有些內容進行了重新排版。(譯者注1:最大的改變是把第1版附錄中的Python教程,單列成了現在的第2章和第3章,并且進行了擴充。可以說,本書第2版對新手更為友好了!)
(譯者注2:毫無疑問,本書是學習Python數據分析最好的參考書。本來想把書名直接譯為《Python數據分析》,這樣更簡短。但是為了尊重第1版的翻譯,考慮到繼承性,還是用老書名。這樣讀過第一版的老讀者可以方便的用之前的書名檢索到第二版。作者在寫第二版的時候,有些文字是照搬第一版的。所以第二版的翻譯也借鑒copy了第一版翻譯:即,如果第二版中有和第一版相同的文字,則copy第一版的中文譯本,覺得不妥的地方會稍加修改,剩下的不同的內容就自己翻譯。這樣做也是為讀過第一版的老讀者考慮——相同的內容可以直接跳過。)
- 利用 Python 進行數據分析 · 第 2 版
- 第 1 章 準備工作
- 第 2 章 Python 語法基礎,IPython 和 Jupyter Notebooks
- 第 3 章 Python 的數據結構、函數和文件
- 第 4 章 NumPy 基礎:數組和矢量計算
- 第 5 章 pandas 入門
- 第 6 章 數據加載、存儲與文件格式
- 第 7 章 數據清洗和準備
- 第 8 章 數據規整:聚合、合并和重塑
- 第 9 章 繪圖和可視化
- 第 10 章 數據聚合與分組運算
- 第 11 章 時間序列
- 第 12 章 pandas 高級應用
- 第 13 章 Python 建模庫介紹
- 第 14 章 數據分析案例
- 附錄 A NumPy 高級應用
- 附錄 B 更多關于 IPython 的內容