<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                ThinkChat2.0新版上線,更智能更精彩,支持會話、畫圖、視頻、閱讀、搜索等,送10W Token,即刻開啟你的AI之旅 廣告
                # 如何在 Python 中加載機器學習數據 > 原文: [https://pythonbasics.org/how-to-load-machine-learning-data-in-python/](https://pythonbasics.org/how-to-load-machine-learning-data-in-python/) 為了使用 Python 啟動您的機器學習項目,您需要能夠正確加載數據。 如果您是 Python 的初學者,本文將幫助您學習如何使用三種不同的技術來加載機器學習數據。 ## 加載機器學習數據 在深入探討之前,您需要知道 CSV 或逗號分隔的值是呈現機器學習數據的最常用格式。 在機器學習數據的 CSV 文件中,您需要了解一些零件和功能。 這些包括: * **CSV 文件標題**:CSV 文件中的標題用于將名稱或標簽自動分配給數據集的每一列。 如果您的文件沒有標題,則必須手動命名屬性。 * **注釋**:當一行以井號(`#`)開頭時,您可以在 CSV 文件中標識注釋。 根據您選擇的加載機器學習數據的方法,您將不得不確定是否要顯示這些注釋,以及如何識別它們。 * **定界符**:定界符分隔字段中的多個值,并用逗號(`,`)表示。 制表符(`\t`)是可以使用的另一個定界符,但是必須明確指定它。 * **引號**:如果文件中的字段值包含空格,則通常會用引號引起來,并且表示該值的符號為雙引號。 如果選擇使用字符,則需要在文件中指定。 在確定了數據文件的這些關鍵部分之后,讓我們繼續學習如何在 Python 中加載機器學習數據的不同方法。 ### 使用 Python 標準庫加載數據 使用 Python 標準庫,您將使用模塊 CSV 和函數`reader()`加載 CSV 文件。 加載后,CSV 數據將自動轉換為 NumPy 數組,可用于機器學習。 例如,下面是一個小代碼,當您使用 Python API 運行時,它將加載沒有標題且包含數字字段的該數據集。 它還將自動將其轉換為 NumPy 數組。 ```py # Load CSV (using python) import csv import numpy filename = 'pima-indians-diabetes.data.csv' raw_data = open(filename, 'rt') reader = csv.reader(raw_data, delimiter=',', quoting=csv.QUOTE_NONE) x = list(reader) data = numpy.array(x).astype('float') print(data.shape) ``` 簡而言之,該代碼命令程序加載一個對象,該對象可以對數據的每一行進行迭代,并且可以輕松地轉換為 NumPy 數組。 運行示例代碼將產生以下形狀的數組: ``` 1 (768, 9) ``` ### 用 NumPy 加載數據文件 在 Python 中加載機器學習數據的另一種方法是使用 NumPy 和`numpy.loadtxt()`函數。 在下面的示例代碼中,該函數假定您的文件沒有標題行,并且所有數據都使用相同的格式。 它還假定文件`pima-indians-diabetes.data.csv`存儲在當前目錄中。 ```py # Load CSV import numpy filename = 'pima-indians-diabetes.data.csv' raw_data = open(filename, 'rt') data = numpy.loadtxt(raw_data, delimiter=",") print(data.shape) ``` 運行上面的示例代碼會將文件加載為`numpy.ndarray`并產生以下數據形狀: ``` 1 (768, 9) ``` 如果可以使用 URL 檢索文件,則可以將以上代碼修改為以下代碼,同時產生相同的數據集: ```py # Load CSV from URL using NumPy from numpy import loadtxt from urllib.request import urlopen url = 'https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indiansiabetes.data.csv' raw_data = urlopen(url) dataset = loadtxt(raw_data, delimiter=",") print(dataset.shape) ``` 運行代碼將產生相同的結果數據形狀: ``` 1 (768, 9) ``` ![python pandas data load csv](https://img.kancloud.cn/5a/5f/5a5f984529bf2479c2fb752bb8684e3a_1160x838.jpg) ### 用 Pandas 加載數據文件 加載機器學習數據的第三種方法是使用 Pandas 和`pandas.read_csv()`函數。 `pandas.read_csv()`函數非常靈活,是加載機器學習數據的最理想方法。 它返回一個`pandas.DataFrame`,使您可以立即開始匯總和繪圖。 下面的示例代碼假定`pima-indians-diabetes.data.csv`文件存儲在當前目錄中。 ```py 1 # Load CSV using Pandas 2 import pandas 3 filename = 'pima-indians-diabetes.data.csv' 4 names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] 5 data = pandas.read_csv(filename, names=names) 6 print(data.shape) ``` 您將在此處注意到,我們已將每個屬性的名稱明確標識為`DataFrame`。 當我們運行上面的示例代碼時,將打印以下形狀的數據: ``` 1 (768, 9) ``` 如果可以使用 URL 檢索文件,則可以對以上代碼進行以下修改,同時生成相同的數據集: ```py 1 # Load CSV using Pandas from URL 2 Import pandas 3 url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv" 4 names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class'] 5 data = pandas.read_csv(url, names=names) 6 print(data.shape) ``` 運行上面的示例代碼將下載一個 CSV 文件,對其進行解析,并生成以下形狀的已加載`DataFrame`: ``` 1 (768, 9) ``` [下載示例和練習](https://gum.co/MnRYU)
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看