更新日期:2018年12月12日
pandas是一個提供快速,靈活和表達性數據結構的Python包,旨在使“關系”或“標記”數據變得簡單直觀。它旨在成為在Python中進行實用的真實世界數據分析的基本高級構建塊。此外,它的更廣泛的目標是成為最強大和最靈活的任何語言的開源數據分析/操作工具。它已經很好地朝著這個目標前進了。
注意:
本文檔假定你熟悉NumPy。如果你還沒有熟練使用NumPy或者根本沒用過numpy,請先花一些時間學習NumPy。
目錄:
新功能
安裝
為pandas貢獻
常見問題(FAQ)
套裝概述
10分鐘入門pandas
教程
指引
數據結構簡介
基本基本功能
使用文本數據
選項和設置
索引和選擇數據
MultiIndex /高級索引
計算工具
使用缺失數據
分組:split-apply-combine
合并,連接和連接
整形和數據透視表
時間系列/日期功能
時間Deltas
分類數據
可視化
樣式
IO工具(文本,CSV,HDF5,...)
遠程數據訪問
增強性能
稀疏數據結構
告誡和訣竅
rpy2 / R interface
pandas生態系統
與R / R庫比較
與SQL比較
與SAS的比較
API參考
內部
發行說明