Pandas是一款開放源碼的BSD許可的Python庫,為Python編程語言提供了高性能,易于使用的數據結構和數據分析工具。Pandas用于廣泛的領域,包括金融,經濟,統計,分析等學術和商業領域。在本教程中,我們將學習Python Pandas的各種功能以及如何在實踐中使用它們。
  Pandas官網: http://pandas.pydata.org/
**Pandas庫的介紹:**
  Pandas是一個開放源碼的Python庫,它使用強大的數據結構提供高性能的數據操作和分析工具。它的名字:Pandas是從Panel Data - 多維數據的計量經濟學(an Econometrics from Multidimensional data)。
  2008年,為滿足需要高性能,靈活的數據分析工具,開發商Wes McKinney開始開發Pandas。
  在Pandas之前,Python主要用于數據遷移和準備。它對數據分析的貢獻更小。 Pandas解決了這個問題。 使用Pandas可以完成數據處理和分析的五個典型步驟,而不管數據的來源 - 加載,準備,操作,模型和分析。
  Python Pandas用于廣泛的領域,包括金融,經濟,統計,分析等學術和商業領域。
  **Pandas的主要特點:**
快速高效的DataFrame對象,具有默認和自定義的索引。
將數據從不同文件格式加載到內存中的數據對象的工具。
丟失數據的數據對齊和綜合處理。重組和擺動日期集。
基于標簽的切片,索引和大數據集的子集。
可以刪除或插入來自數據結構的列。
按數據分組進行聚合和轉換。
高性能合并和數據加入。
時間序列功能。
**讀者**
本教程為準備學習Pandas基礎知識和各種功能的人員而做準備的。它對數據清理和分析的人員特別有用。 完成本教程之后,將發現自己處于適度的專業知識水平,可以從中獲得更高水平的專業知識。
**先決條件**
要求對計算機編程術語有一個基本的了解。 對任何編程語言的基本了解是一個加分。Pandas庫使用NumPy的大部分功能。建議在學習本教程之前,先閱讀NumPy的教程。