<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                合規國際互聯網加速 OSASE為企業客戶提供高速穩定SD-WAN國際加速解決方案。 廣告
                # 使用 Pandas 為 Python 中的機器學習準備數據 > 原文: [https://machinelearningmastery.com/prepare-data-for-machine-learning-in-python-with-pandas/](https://machinelearningmastery.com/prepare-data-for-machine-learning-in-python-with-pandas/) 如果您使用 Python 堆棧來學習和應用機器學習,那么您將要用于數據分析和數據操作的庫是 Pandas。 這篇文章為您提供了熊貓庫的快速介紹,并指出了正確的入門方向。 [![pandas for data analysis](https://img.kancloud.cn/19/98/1998626a5b6e81b441eb3776c580ac9a_640x427.jpg)](https://3qeqpr26caki16dnhd19sv6by6v-wpengine.netdna-ssl.com/wp-content/uploads/2014/06/pandas-for-data-analysis.jpg) 用于數據分析的熊貓。 照 [gzlu](https://www.flickr.com/photos/gzlu/7708872342) ,保留一些權利。 ## Python 中的數據分析 Python SciPy 堆棧通常適用于科學計算。它提供了強大的庫來處理網格數據(如 NumPy)和繪圖(如 matplotlib)。直到最近,套件中缺少的一個部件才是處理數據的好庫。 數據通常不是以易于使用的形式出現的。處理機器學習等數據驅動問題的很大一部分是數據分析和數據調整。 * **數據分析**:這是使用統計和數據可視化等工具,通過了解數據來更好地理解問題。 * **Data Munging** :這是將原始數據轉換為表格的過程,以便適合您的工作,如數據分析或機器學習。 傳統上,您必須在 Python 中拼湊自己的腳本工具鏈來執行這些任務。 如今,如果您在 Python 中搜索數據分析,則無法避免了解 Pandas。它已迅速成為 Python 中數據處理的首選庫。 ## 什么是熊貓? Pandas 是一個用于數據分析和數據操作的 Python 庫。它將缺少的部分添加到 SciPy 框架以處理數據。 熊貓是由 [Wes McKinney](http://blog.wesmckinney.com/) 于 2008 年創建的,主要用于量化金融工作。因此,它在處理時間序列數據和圖表方面具有堅實的基礎。 您使用 Pandas 將數據加載到 Python 中并執行數據分析任務。它非常適合處理表格數據,如來自關系數據庫的數據或來自電子表格的數據。 Wes 描述了 Pandas 對 crate 的看法:用于任何語言的最強大,最靈活的開源數據分析和操作工具。 如果只是為了讓您自己的數據分析工作變得更容易,那么這項令人欽佩的任務就是讓您想要支持他的事業。 ## 熊貓特色 熊貓是一種樂趣。 根據我的經驗,它簡單,優雅,直觀。來自 R,成語和操作是熟悉和相關的。 Pandas 構建在 SciPy 堆棧中的標準庫之上。它使用 NumPy 進行快速數組處理,并為 StatsModels 的一些統計操作和 Matplotlib 的圖表提供方便的包裝。 鑒于庫在金融領域的開始,人們非常關注時間序列。它還非常關注用于處理標準網格數據的數據幀。數據處理是此類庫的核心要求,速度已成為優先事項。它速度快,提供數據結構和操作,如索引和稀疏性處理。 需要注意的一些重要功能包括“ * **操縱**:移動列,切片,整形,合并,連接,過濾等。 * **時間序列處理**:對日期/時間,重新采樣,移動窗口和數據集自動對齊的操作。 * **缺少數據處理**:自動排除,刪除,替換,插入缺失值 * **分組操作**:SQL like group by。 * **分層索引**:數據結構級別,對按列有效組織數據非常有用。 * **摘要統計**:快速而強大的數據匯總統計。 * **可視化**:簡化了對數據結構圖的訪問,例如直方圖,箱形圖,一般圖和散點圖。 Pandas 在許可許可證(Simplified BSD)下可用,并且可以與 SciPy 的其余部分一起輕松安裝。 ## 熊貓資源 這是對熊貓庫的快速介紹,還有更多需要學習的內容。安裝庫,獲取數據集并開始嘗試。沒有更好的入門方式。 訪問 [Pandas 主頁](http://pandas.pydata.org)并閱讀庫愿景和功能。您也可以查看項目的 [github 頁面](https://github.com/pydata/pandas)。 一個很好的起點是[教程列表](http://pandas.pydata.org/pandas-docs/stable/tutorials.html),其中包括指向網絡上的烹飪書,課程和各種著名的 IPython 筆記本的鏈接。 最后,對我來說,我住在 [API 文檔](http://pandas.pydata.org/pandas-docs/stable/api.html)中。 ### 文件 我發現論文可以很好地概述開源庫,特別是在 Python 和 R 生態系統中。請查看以下論文,了解熊貓的全部內容。 * [Python 中統計計算的數據結構](http://scholar.google.com/scholar?hl=en&q=Data+Structures+for+Statistical+Computing+in+Python) * [pandas:用于數據分析和統計的基礎 Python 庫](http://scholar.google.com/scholar?q=pandas%3A+a+Foundational+Python+Library+for+Data+Analysis+and+Statistics) ### 影片 YouTube 上有很多關于人們在自己的數據和會議上展示 Pandas 的精彩視頻。 一個很好的起點是 Wes 自己 [10 分鐘的熊貓之旅](http://vimeo.com/59324550)。看一看。這是一個很小的時間序列數據,但它是一個偉大而快速的概述。您還可以查看他的 [IPython 筆記本進行本次巡演](http://nbviewer.ipython.org/urls/gist.github.com/wesm/4757075/raw/a72d3450ad4924d0e74fb57c9f62d1d895ea4574/PandasTour.ipynb)。 ### 圖書 [![Amazon Image](https://img.kancloud.cn/8a/ac/8aac70c135341e6f96a25d5596043bf0_84x110.jpg)](http://www.amazon.com/dp/1449319793?tag=inspiredalgor-20) 最后,Wes 是 Python 中關于數據分析的權威書籍的作者。如果你想認真練習,還要考慮抓住這本書。它被稱為:[用于數據分析的 Python:與 Pandas,NumPy 和 IPython](http://www.amazon.com/dp/1449319793?tag=inspiredalgor-20) 進行數據爭奪。
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看