# 您在 Python 中的第一個機器學習項目循序漸進
> 原文: [https://machinelearningmastery.com/machine-learning-in-python-step-by-step/](https://machinelearningmastery.com/machine-learning-in-python-step-by-step/)
你想用 Python 做機器學習,但是你開始時遇到了麻煩嗎?
在這篇文章中,您將使用 Python 完成您的第一個機器學習項目。
在本分步教程中,您將:
1. 下載并安裝 Python SciPy 并獲得最有用的 Python 機器學習包。
2. 加載數據集并使用統計摘要和數據可視化了解其結構。
3. 創建 6 個機器學習模型,挑選最佳并建立準確性可靠的信心。
如果您是一名機器學習初學者,并希望最終開始使用 Python,那么本教程就是為您設計的。
讓我們開始吧!
* **2017 年 1 月更新**:已更新,以反映版本 0.18 中 scikit-learn API 的更改。
* **2017 年 3 月更新**:添加了幫助設置 Python 環境的鏈接。
* **Update Apr / 2018** :添加了一些有關隨機性和預測的有用鏈接。
* **Update Sep / 2018** :由于 UCI 變得不可靠,添加了我自己托管的數據集版本的鏈接。
* **2002 年 2 月更新**:更新以解決使用 SVM 和 Logistic 回歸的 sklearn API 版本 0.20+的警告,還更新了結果和圖表。

您在 Python 中的第一個機器學習項目循序漸進
照片由 [cosmoflash](https://www.flickr.com/photos/cosmoflash/2687052480/) ,保留一些權利。
## 如何在 Python 中啟動機器學習?
學習機器學習的最好方法是設計和完成小項目。
### 入門時 Python 可能會令人生畏
Python 是一種流行且強大的解釋語言。與 R 不同,Python 是一種完整的語言和平臺,可用于研究和開發以及開發生產系統。
還有許多模塊和庫可供選擇,提供了多種方法來完成每項任務。它可以感到壓倒性的。
開始使用 Python 進行機器學習的最佳方法是完成一個項目。
* 它將強制您安裝并啟動 Python 解釋器(至少)。
* 它將為您提供如何逐步完成小項目的鳥瞰圖。
* 它會給你信心,也許會繼續你自己的小項目。
### 初學者需要一個小型的端到端項目
書籍和課程令人沮喪。它們為您提供了大量的秘籍和片段,但您永遠不會看到它們如何組合在一起。
當您將機器學習應用于您自己的數據集時,您正在處理一個項目。
機器學習項目可能不是線性的,但它有許多眾所周知的步驟:
1. 定義問題。
2. 準備數據。
3. 評估算法。
4. 改善結果。
5. 目前的結果。
真正與新平臺或工具達成協議的最佳方式是端到端地完成機器學習項目并涵蓋關鍵步驟。即,從加載數據,匯總數據,評估算法和做出一些預測。
如果可以這樣做,則可以使用可在數據集之后的數據集上使用的模板。一旦您更有信心,您可以填寫差距,例如進一步的數據準備和改進結果任務。
### 你好機器學習世界
開始使用新工具的最佳小項目是虹膜花的分類(例如[虹膜數據集](https://archive.ics.uci.edu/ml/datasets/Iris))。
這是一個很好的項目,因為它非常了解。
* 屬性是數字,因此您必須弄清楚如何加載和處理數據。
* 這是一個分類問題,允許您練習一種更簡單的監督學習算法。
* 這是一個多類別的分類問題(多名義),可能需要一些專門的處理。
* 它只有 4 個屬性和 150 行,這意味著它很小,很容易適合內存(和屏幕或 A4 頁面)。
* 所有數字屬性都具有相同的單位和相同的比例,不需要任何特殊的縮放或變換即可開始。
讓我們開始使用 Python 的 hello world 機器學習項目。
## Python 中的機器學習:循序漸進教程
(從這里開始)
在本節中,我們將通過端到端的小型機器學習項目進行工作。
以下是我們將要介紹的內容概述:
1. 安裝 Python 和 SciPy 平臺。
2. 加載數據集。
3. 總結數據集。
4. 可視化數據集。
5. 評估一些算法。
6. 做一些預測。
慢慢來。完成每個步驟。
嘗試自己輸入命令或復制并粘貼命令以加快速度。
如果您有任何疑問,請在帖子底部留言。
## 1.下載,安裝和啟動 Python SciPy
如果尚未安裝,請在您的系統上安裝 Python 和 SciPy 平臺。
我不想詳細介紹這個,因為其他人已經有了。這已經非常簡單,特別是如果您是開發人員。如果您確實需要幫助,請在評論中提問。
### 1.1 安裝 SciPy 庫
本教程假定 Python 版本為 2.7 或 3.5+。
您需要安裝 5 個密鑰庫。下面是本教程所需的 Python SciPy 庫列表:
* SciPy 的
* numpy 的
* matplotlib
* 大熊貓
* sklearn
有許多方法可以安裝這些庫。我最好的建議是選擇一種方法,然后在安裝每個庫時保持一致。
[scipy 安裝頁面](http://www.scipy.org/install.html)提供了在多個不同平臺上安裝上述庫的優秀說明,例如 Linux,mac OS X 和 Windows。如果您有任何疑問或疑問,請參閱本指南,數千人已經關注。
* 在 Mac OS X 上,您可以使用 macport 來安裝 Python 2.7 和這些庫。有關 macports 的更多信息,[請參閱主頁](https://www.macports.org/install.php)。
* 在 Linux 上,您可以使用您的包管理器,例如 Fedora 上的 yum 來安裝 RPM。
如果你在 Windows 上或者你沒有信心,我會建議你安裝免費版的 [Anaconda](https://www.continuum.io/downloads) ,其中包括你需要的一切。
**注意**:本教程假設您安裝了 scikit-learn 版本 0.18 或更高版本。
需要更多幫助?請參閱以下教程之一:
* [如何使用 Anaconda 設置用于機器學習和深度學習的 Python 環境](http://machinelearningmastery.com/setup-python-environment-machine-learning-deep-learning-anaconda/)
* [如何使用 Python 3](http://machinelearningmastery.com/linux-virtual-machine-machine-learning-development-python-3/) 為機器學習開發創建 Linux 虛擬機
### 1.2 啟動 Python 并檢查版本
確保您的 Python 環境已成功安裝并按預期工作是一個好主意。
下面的腳本將幫助您測試您的環境。它導入本教程中所需的每個庫并打印該版本。
打開命令行并啟動 python 解釋器:
```
python
```
我建議直接在解釋器中工作或編寫腳本并在命令行上運行它們,而不是大編輯器和 IDE。保持簡單,專注于機器學習而不是工具鏈。
鍵入或復制并粘貼以下腳本:
```
# Check the versions of libraries
# Python version
import sys
print('Python: {}'.format(sys.version))
# scipy
import scipy
print('scipy: {}'.format(scipy.__version__))
# numpy
import numpy
print('numpy: {}'.format(numpy.__version__))
# matplotlib
import matplotlib
print('matplotlib: {}'.format(matplotlib.__version__))
# pandas
import pandas
print('pandas: {}'.format(pandas.__version__))
# scikit-learn
import sklearn
print('sklearn: {}'.format(sklearn.__version__))
```
這是我在 OS X 工作站上獲得的輸出:
```
Python: 3.6.8 (default, Dec 30 2018, 13:01:55)
[GCC 4.2.1 Compatible Apple LLVM 9.1.0 (clang-902.0.39.2)]
scipy: 1.1.0
numpy: 1.15.4
matplotlib: 3.0.2
pandas: 0.23.4
sklearn: 0.20.2
```
將上述輸出與您的版本進行比較。
理想情況下,您的版本應該匹配或更新。 API 不會快速更改,因此如果您只是背后的幾個版本,請不要太擔心,本教程中的所有內容很可能仍適用于您。
如果您收到錯誤,請停止。現在是時候解決它了。
如果您無法干凈地運行上述腳本,則無法完成本教程。
我最好的建議是谷歌搜索你的錯誤信息或在 [Stack Exchange](http://stackoverflow.com/questions/tagged/python) 上發帖提問。
## 2.加載數據
我們將使用虹膜花數據集。這個數據集很有名,因為它幾乎被所有人用作機器學習和統計中的“hello world”數據集。
該數據集包含 150 個鳶尾花的觀察結果。以厘米為單位的花有四列測量值。第五列是觀察到的花的種類。所有觀察到的花屬于三種物種之一。
您可以[在維基百科](https://en.wikipedia.org/wiki/Iris_flower_data_set)上了解有關此數據集的更多信息。
在此步驟中,我們將從 CSV 文件 URL 加載虹膜數據。
### 2.1 導入庫
首先,讓我們導入我們將在本教程中使用的所有模塊,函數和對象。
```
# Load libraries
import pandas
from pandas.plotting import scatter_matrix
import matplotlib.pyplot as plt
from sklearn import model_selection
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix
from sklearn.metrics import accuracy_score
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.naive_bayes import GaussianNB
from sklearn.svm import SVC
```
一切都應該加載沒有錯誤。如果您有錯誤,請停止。在繼續之前,您需要一個有效的 SciPy 環境。請參閱上面有關設置環境的建議。
### 2.2 加載數據集
我們可以直接從 UCI 機器學習庫加載數據。
我們正在使用 pandas 來加載數據。我們還將使用 pandas 來探索數據,包括描述性統計和數據可視化。
請注意,我們在加載數據時指定每列的名稱。這將有助于我們以后探索數據。
```
# Load dataset
url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv"
names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']
dataset = pandas.read_csv(url, names=names)
```
數據集應該加載而不會發生意外。
如果確實存在網絡問題,可以將 [iris.csv](https://raw.githubusercontent.com/jbrownlee/Datasets/master/iris.csv) 文件下載到工作目錄中,并使用相同的方法加載它,將 URL 更改為本地文件名。
## 3.總結數據集
現在是時候看看數據了。
在這一步中,我們將以幾種不同的方式來看看數據:
1. 數據集的維度。
2. 窺視數據本身。
3. 所有屬性的統計摘要。
4. 按類變量細分數據。
別擔心,每次查看數據都是一個命令。這些是有用的命令,您可以在將來的項目中反復使用這些命令。
### 3.1 數據集的維度
我們可以快速了解數據包含多少個實例(行)和多少屬性(列)以及 shape 屬性。
```
# shape
print(dataset.shape)
```
您應該看到 150 個實例和 5 個屬性:
```
(150, 5)
```
### 3.2 查看數據
實際觀察您的數據也是一個好主意。
```
# head
print(dataset.head(20))
```
您應該看到數據的前 20 行:
```
sepal-length sepal-width petal-length petal-width class
0 5.1 3.5 1.4 0.2 Iris-setosa
1 4.9 3.0 1.4 0.2 Iris-setosa
2 4.7 3.2 1.3 0.2 Iris-setosa
3 4.6 3.1 1.5 0.2 Iris-setosa
4 5.0 3.6 1.4 0.2 Iris-setosa
5 5.4 3.9 1.7 0.4 Iris-setosa
6 4.6 3.4 1.4 0.3 Iris-setosa
7 5.0 3.4 1.5 0.2 Iris-setosa
8 4.4 2.9 1.4 0.2 Iris-setosa
9 4.9 3.1 1.5 0.1 Iris-setosa
10 5.4 3.7 1.5 0.2 Iris-setosa
11 4.8 3.4 1.6 0.2 Iris-setosa
12 4.8 3.0 1.4 0.1 Iris-setosa
13 4.3 3.0 1.1 0.1 Iris-setosa
14 5.8 4.0 1.2 0.2 Iris-setosa
15 5.7 4.4 1.5 0.4 Iris-setosa
16 5.4 3.9 1.3 0.4 Iris-setosa
17 5.1 3.5 1.4 0.3 Iris-setosa
18 5.7 3.8 1.7 0.3 Iris-setosa
19 5.1 3.8 1.5 0.3 Iris-setosa
```
### 3.3 統計摘要
現在我們可以看一下每個屬性的摘要。
這包括計數,平均值,最小值和最大值以及一些百分位數。
```
# descriptions
print(dataset.describe())
```
我們可以看到所有數值都具有相同的比例(厘米)和 0 到 8 厘米之間的相似范圍。
```
sepal-length sepal-width petal-length petal-width
count 150.000000 150.000000 150.000000 150.000000
mean 5.843333 3.054000 3.758667 1.198667
std 0.828066 0.433594 1.764420 0.763161
min 4.300000 2.000000 1.000000 0.100000
25% 5.100000 2.800000 1.600000 0.300000
50% 5.800000 3.000000 4.350000 1.300000
75% 6.400000 3.300000 5.100000 1.800000
max 7.900000 4.400000 6.900000 2.500000
```
### 3.4 類分布
現在讓我們看一下屬于每個類的實例(行)數。我們可以將其視為絕對計數。
```
# class distribution
print(dataset.groupby('class').size())
```
我們可以看到每個類具有相同數量的實例(數據集的 50%或 33%)。
```
class
Iris-setosa 50
Iris-versicolor 50
Iris-virginica 50
```
## 4.數據可視化
我們現在對數據有一個基本的想法。我們需要通過一些可視化來擴展它。
我們將看兩種類型的圖:
1. 單變量圖可以更好地理解每個屬性。
2. 多變量圖可以更好地理解屬性之間的關系。
### 4.1 單變量圖
我們從一些單變量圖開始,即每個變量的圖。
鑒于輸入變量是數字,我們可以創建每個的框和晶須圖。
```
# box and whisker plots
dataset.plot(kind='box', subplots=True, layout=(2,2), sharex=False, sharey=False)
plt.show()
```
這使我們更清楚地了解輸入屬性的分布:

鳶尾花數據集的每個輸入變量的框和晶須圖
我們還可以創建每個輸入變量的直方圖,以了解分布。
```
# histograms
dataset.hist()
plt.show()
```
看起來可能有兩個輸入變量具有高斯分布。這很有用,因為我們可以使用可以利用這個假設的算法。

鳶尾花數據集的每個輸入變量的直方圖
### 4.2 多變量圖
現在我們可以看看變量之間的相互作用。
首先,讓我們看一下所有屬性對的散點圖。這有助于發現輸入變量之間的結構化關系。
```
# scatter plot matrix
scatter_matrix(dataset)
plt.show()
```
注意一些屬性對的對角分組。這表明高度相關性和可預測的關系。

鳶尾花數據集的每個輸入變量的散點圖矩陣
## 5.評估一些算法
現在是時候創建一些數據模型并估計它們對看不見的數據的準確性。
以下是我們將在此步驟中介紹的內容:
1. 分離出驗證數據集。
2. 設置測試工具以使用 10 倍交叉驗證。
3. 建立 5 種不同的模型來預測花卉測量的物種
4. 選擇最佳型號。
### 5.1 創建驗證數據集
我們需要知道我們創建的模型是好的。
稍后,我們將使用統計方法來估計我們在看不見的數據上創建的模型的準確性。我們還希望通過對實際看不見的數據進行評估,對未見數據的最佳模型的準確性進行更具體的估計。
也就是說,我們將阻止算法無法看到的一些數據,我們將使用這些數據來獲得關于最佳模型實際精確度的第二個獨立概念。
我們將加載的數據集分成兩部分,其中 80%將用于訓練我們的模型,20%我們將作為驗證數據集。
```
# Split-out validation dataset
array = dataset.values
X = array[:,0:4]
Y = array[:,4]
validation_size = 0.20
seed = 7
X_train, X_validation, Y_train, Y_validation = model_selection.train_test_split(X, Y, test_size=validation_size, random_state=seed)
```
您現在在 _X_train_ 和 _Y_train_ 中有訓練數據用于準備模型, _X_validation_ 和 _Y_validation_ 設置我們以后可以使用。
請注意,我們使用 python 切片來選擇 NumPy 數組中的列。如果這對您來說是新手,您可能需要查看此帖子:
* [如何在 Python 中為機器學習索引,切片和重塑 NumPy 數組](https://machinelearningmastery.com/index-slice-reshape-numpy-arrays-machine-learning-python/)
### 5.2 測試線束
我們將使用 10 倍交叉驗證來估計準確性。
這會將我們的數據集分成 10 個部分,在 9 上訓練并在 1 上進行測試,并重復訓練測試分割的所有組合。
```
# Test options and evaluation metric
seed = 7
scoring = 'accuracy'
```
具體隨機種子無關緊要,請在此處了解有關偽隨機數生成器的更多信息:
* [Python 機器學習隨機數生成器簡介](https://machinelearningmastery.com/introduction-to-random-number-generators-for-machine-learning/)
我們使用'_ 準確度 _'的度量來評估模型。這是正確預測的實例數除以數據集中實例總數乘以 100 得到百分比(例如 95%準確)的比率。我們將在運行構建時使用 _ 評分 _ 變量,然后評估每個模型。
### 5.3 構建模型
我們不知道哪個算法可以解決此問題或使用哪些配置。我們從圖中得出一個概念,即某些類在某些維度上可以部分線性分離,因此我們期望得到普遍良好的結果。
讓我們評估 6 種不同的算法:
* Logistic 回歸(LR)
* 線性判別分析(LDA)
* K-Nearest Neighbors(KNN)。
* 分類和回歸樹(CART)。
* 高斯樸素貝葉斯(NB)。
* 支持向量機(SVM)。
這是簡單線性(LR 和 LDA),非線性(KNN,CART,NB 和 SVM)算法的良好混合。我們在每次運行之前重置隨機數種子,以確保使用完全相同的數據分割執行每個算法的評估。它確保結果可直接比較。
讓我們構建和評估我們的模型:
```
# Spot Check Algorithms
models = []
models.append(('LR', LogisticRegression(solver='liblinear', multi_class='ovr')))
models.append(('LDA', LinearDiscriminantAnalysis()))
models.append(('KNN', KNeighborsClassifier()))
models.append(('CART', DecisionTreeClassifier()))
models.append(('NB', GaussianNB()))
models.append(('SVM', SVC(gamma='auto')))
# evaluate each model in turn
results = []
names = []
for name, model in models:
kfold = model_selection.KFold(n_splits=10, random_state=seed)
cv_results = model_selection.cross_val_score(model, X_train, Y_train, cv=kfold, scoring=scoring)
results.append(cv_results)
names.append(name)
msg = "%s: %f (%f)" % (name, cv_results.mean(), cv_results.std())
print(msg)
```
### 5.4 選擇最佳模型
我們現在有 6 個模型和精度估計。我們需要將模型相互比較并選擇最準確的模型。
運行上面的示例,我們得到以下原始結果:
```
LR: 0.966667 (0.040825)
LDA: 0.975000 (0.038188)
KNN: 0.983333 (0.033333)
CART: 0.975000 (0.038188)
NB: 0.975000 (0.053359)
SVM: 0.991667 (0.025000)
```
請注意,您的結果可能會有所不同。有關詳細信息,請參閱帖子:
* [在機器學習中擁抱隨機性](https://machinelearningmastery.com/randomness-in-machine-learning/)
在這種情況下,我們可以看到支持向量機(SVM)看起來具有最大的估計準確度分數。
我們還可以創建模型評估結果的圖表,并比較每個模型的傳播和平均準確度。每種算法都有一組精確度測量值,因為每種算法都被評估了 10 次(10 次交叉驗證)。
```
# Compare Algorithms
fig = plt.figure()
fig.suptitle('Algorithm Comparison')
ax = fig.add_subplot(111)
plt.boxplot(results)
ax.set_xticklabels(names)
plt.show()
```
您可以看到盒子和須狀圖在該范圍的頂部被壓扁,許多樣品達到 100%的準確度。

鳶尾花數據集上的盒子和晶須圖比較機器學習算法
## 6.做出預測
KNN 算法非常簡單,是基于我們測試的精確模型。現在我們想要了解模型在驗證集上的準確性。
這將使我們對最佳模型的準確性進行獨立的最終檢查。保留驗證集非常有用,以防您在訓練過程中出現問題,例如過度擬合訓練集或數據泄漏。兩者都會導致過于樂觀的結果。
我們可以直接在驗證集上運行 KNN 模型,并將結果匯??總為最終準確度分數,[混淆矩陣](http://machinelearningmastery.com/confusion-matrix-machine-learning/)和分類報告。
```
# Make predictions on validation dataset
knn = KNeighborsClassifier()
knn.fit(X_train, Y_train)
predictions = knn.predict(X_validation)
print(accuracy_score(Y_validation, predictions))
print(confusion_matrix(Y_validation, predictions))
print(classification_report(Y_validation, predictions))
```
我們可以看到精度為 0.9 或 90%。混淆矩陣提供了三個錯誤的指示。最后,分類報告按精度,召回,f1 分數和支持顯示每個類別的細分,顯示出優異的結果(授予驗證數據集很小)。
```
0.9
[[ 7 0 0]
[ 0 11 1]
[ 0 2 9]]
precision recall f1-score support
Iris-setosa 1.00 1.00 1.00 7
Iris-versicolor 0.85 0.92 0.88 12
Iris-virginica 0.90 0.82 0.86 11
micro avg 0.90 0.90 0.90 30
macro avg 0.92 0.91 0.91 30
weighted avg 0.90 0.90 0.90 30
```
您可以在此處了解有關如何進行預測和預測概率的更多信息:
* [如何用 scikit-learn](https://machinelearningmastery.com/make-predictions-scikit-learn/) 進行預測
## 你可以用 Python 做機器學習
完成上面的教程。最多需要 5 到 10 分鐘!
**你不需要了解一切**。 (至少現在不是)您的目標是端到端地完成教程并獲得結果。您無需了解第一遍的所有內容。隨時記下您的問題。在 Python 中大量使用 _ 幫助(“FunctionName”)_ 幫助語法來了解您正在使用的所有函數。
**你不需要知道算法如何工作**。了解限制以及如何配置機器學習算法非常重要。但是學習算法可以在以后學習。您需要在很長一段時間內慢慢構建此算法知識。今天,首先要熟悉平臺。
**你不需要成為 Python 程序員**。如果您是新手,Python 語言的語法可以很直觀。與其他語言一樣,重點關注函數調用(例如 _ 函數()_)和賦值(例如 _a =“b”_)。這將幫助您完成大部分工作。您是一名開發人員,您知道如何快速掌握語言的基礎知識。剛開始并稍后深入了解細節。
**您不需要成為機器學習專家**。您可以稍后了解各種算法的優點和局限性,有很多帖子可供您稍后閱讀,以了解機器學習項目的步驟以及使用交叉驗證評估準確性的重要性。
**機器學習項目**中的其他步驟怎么樣?我們沒有涵蓋機器學習項目中的所有步驟,因為這是您的第一個項目,我們需要關注關鍵步驟。即,加載數據,查看數據,評估一些算法并做出一些預測。在后面的教程中,我們可以查看其他數據準備和結果改進任務。
## 摘要
在這篇文章中,您逐步了解了如何使用 Python 完成第一個機器學習項目。
您發現完成一個小型端到端項目從加載數據到進行預測是熟悉新平臺的最佳方式。
### 你的下一步
你是否完成了本教程?
1. 完成上面的教程。
2. 列出您的任何問題。
3. 搜索或研究答案。
4. 請記住,您可以使用 Python 中的 _ 幫助(“FunctionName”)_ 來獲取任何函數的幫助。
你有問題嗎?
在下面的評論中發布。
- Machine Learning Mastery 應用機器學習教程
- 5競爭機器學習的好處
- 過度擬合的簡單直覺,或者為什么測試訓練數據是一個壞主意
- 特征選擇簡介
- 應用機器學習作為一個搜索問題的溫和介紹
- 為什么應用機器學習很難
- 為什么我的結果不如我想的那么好?你可能過度擬合了
- 用ROC曲線評估和比較分類器表現
- BigML評論:發現本機學習即服務平臺的聰明功能
- BigML教程:開發您的第一個決策樹并進行預測
- 構建生產機器學習基礎設施
- 分類準確性不夠:可以使用更多表現測量
- 一種預測模型的巧妙應用
- 機器學習項目中常見的陷阱
- 數據清理:將凌亂的數據轉換為整潔的數據
- 機器學習中的數據泄漏
- 數據,學習和建模
- 數據管理至關重要以及為什么需要認真對待它
- 將預測模型部署到生產中
- 參數和超參數之間有什么區別?
- 測試和驗證數據集之間有什么區別?
- 發現特征工程,如何設計特征以及如何獲得它
- 如何開始使用Kaggle
- 超越預測
- 如何在評估機器學習算法時選擇正確的測試選項
- 如何定義機器學習問題
- 如何評估機器學習算法
- 如何獲得基線結果及其重要性
- 如何充分利用機器學習數據
- 如何識別數據中的異常值
- 如何提高機器學習效果
- 如何在競爭機器學習中踢屁股
- 如何知道您的機器學習模型是否具有良好的表現
- 如何布局和管理您的機器學習項目
- 如何為機器學習準備數據
- 如何減少最終機器學習模型中的方差
- 如何使用機器學習結果
- 如何解決像數據科學家這樣的問題
- 通過數據預處理提高模型精度
- 處理機器學習的大數據文件的7種方法
- 建立機器學習系統的經驗教訓
- 如何使用機器學習清單可靠地獲得準確的預測(即使您是初學者)
- 機器學習模型運行期間要做什么
- 機器學習表現改進備忘單
- 來自世界級從業者的機器學習技巧:Phil Brierley
- 模型預測精度與機器學習中的解釋
- 競爭機器學習的模型選擇技巧
- 機器學習需要多少訓練數據?
- 如何系統地規劃和運行機器學習實驗
- 應用機器學習過程
- 默認情況下可重現的機器學習結果
- 10個實踐應用機器學習的標準數據集
- 簡單的三步法到最佳機器學習算法
- 打擊機器學習數據集中不平衡類的8種策略
- 模型表現不匹配問題(以及如何處理)
- 黑箱機器學習的誘惑陷阱
- 如何培養最終的機器學習模型
- 使用探索性數據分析了解您的問題并獲得更好的結果
- 什么是數據挖掘和KDD
- 為什么One-Hot在機器學習中編碼數據?
- 為什么你應該在你的機器學習問題上進行抽樣檢查算法
- 所以,你正在研究機器學習問題......
- Machine Learning Mastery Keras 深度學習教程
- Keras 中神經網絡模型的 5 步生命周期
- 在 Python 迷你課程中應用深度學習
- Keras 深度學習庫的二元分類教程
- 如何用 Keras 構建多層感知器神經網絡模型
- 如何在 Keras 中檢查深度學習模型
- 10 個用于 Amazon Web Services 深度學習的命令行秘籍
- 機器學習卷積神經網絡的速成課程
- 如何在 Python 中使用 Keras 進行深度學習的度量
- 深度學習書籍
- 深度學習課程
- 你所知道的深度學習是一種謊言
- 如何設置 Amazon AWS EC2 GPU 以訓練 Keras 深度學習模型(分步)
- 神經網絡中批量和迭代之間的區別是什么?
- 在 Keras 展示深度學習模型訓練歷史
- 基于 Keras 的深度學習模型中的dropout正則化
- 評估 Keras 中深度學習模型的表現
- 如何評價深度學習模型的技巧
- 小批量梯度下降的簡要介紹以及如何配置批量大小
- 在 Keras 中獲得深度學習幫助的 9 種方法
- 如何使用 Keras 在 Python 中網格搜索深度學習模型的超參數
- 用 Keras 在 Python 中使用卷積神經網絡進行手寫數字識別
- 如何用 Keras 進行預測
- 用 Keras 進行深度學習的圖像增強
- 8 個深度學習的鼓舞人心的應用
- Python 深度學習庫 Keras 簡介
- Python 深度學習庫 TensorFlow 簡介
- Python 深度學習庫 Theano 簡介
- 如何使用 Keras 函數式 API 進行深度學習
- Keras 深度學習庫的多類分類教程
- 多層感知器神經網絡速成課程
- 基于卷積神經網絡的 Keras 深度學習庫中的目標識別
- 流行的深度學習庫
- 用深度學習預測電影評論的情感
- Python 中的 Keras 深度學習庫的回歸教程
- 如何使用 Keras 獲得可重現的結果
- 如何在 Linux 服務器上運行深度學習實驗
- 保存并加載您的 Keras 深度學習模型
- 用 Keras 逐步開發 Python 中的第一個神經網絡
- 用 Keras 理解 Python 中的有狀態 LSTM 循環神經網絡
- 在 Python 中使用 Keras 深度學習模型和 Scikit-Learn
- 如何使用預訓練的 VGG 模型對照片中的物體進行分類
- 在 Python 和 Keras 中對深度學習模型使用學習率調度
- 如何在 Keras 中可視化深度學習神經網絡模型
- 什么是深度學習?
- 何時使用 MLP,CNN 和 RNN 神經網絡
- 為什么用隨機權重初始化神經網絡?
- Machine Learning Mastery 深度學習 NLP 教程
- 深度學習在自然語言處理中的 7 個應用
- 如何實現自然語言處理的波束搜索解碼器
- 深度學習文檔分類的最佳實踐
- 關于自然語言處理的熱門書籍
- 在 Python 中計算文本 BLEU 分數的溫和介紹
- 使用編碼器 - 解碼器模型的用于字幕生成的注入和合并架構
- 如何用 Python 清理機器學習的文本
- 如何配置神經機器翻譯的編碼器 - 解碼器模型
- 如何開始深度學習自然語言處理(7 天迷你課程)
- 自然語言處理的數據集
- 如何開發一種深度學習的詞袋模型來預測電影評論情感
- 深度學習字幕生成模型的溫和介紹
- 如何在 Keras 中定義神經機器翻譯的編碼器 - 解碼器序列 - 序列模型
- 如何利用小實驗在 Keras 中開發字幕生成模型
- 如何從頭開發深度學習圖片標題生成器
- 如何在 Keras 中開發基于字符的神經語言模型
- 如何開發用于情感分析的 N-gram 多通道卷積神經網絡
- 如何從零開始開發神經機器翻譯系統
- 如何在 Python 中用 Keras 開發基于單詞的神經語言模型
- 如何開發一種預測電影評論情感的詞嵌入模型
- 如何使用 Gensim 在 Python 中開發詞嵌入
- 用于文本摘要的編碼器 - 解碼器深度學習模型
- Keras 中文本摘要的編碼器 - 解碼器模型
- 用于神經機器翻譯的編碼器 - 解碼器循環神經網絡模型
- 淺談詞袋模型
- 文本摘要的溫和介紹
- 編碼器 - 解碼器循環神經網絡中的注意力如何工作
- 如何利用深度學習自動生成照片的文本描述
- 如何開發一個單詞級神經語言模型并用它來生成文本
- 淺談神經機器翻譯
- 什么是自然語言處理?
- 牛津自然語言處理深度學習課程
- 如何為機器翻譯準備法語到英語的數據集
- 如何為情感分析準備電影評論數據
- 如何為文本摘要準備新聞文章
- 如何準備照片標題數據集以訓練深度學習模型
- 如何使用 Keras 為深度學習準備文本數據
- 如何使用 scikit-learn 為機器學習準備文本數據
- 自然語言處理神經網絡模型入門
- 對自然語言處理的深度學習的承諾
- 在 Python 中用 Keras 進行 LSTM 循環神經網絡的序列分類
- 斯坦福自然語言處理深度學習課程評價
- 統計語言建模和神經語言模型的簡要介紹
- 使用 Keras 在 Python 中進行 LSTM 循環神經網絡的文本生成
- 淺談機器學習中的轉換
- 如何使用 Keras 將詞嵌入層用于深度學習
- 什么是用于文本的詞嵌入
- Machine Learning Mastery 深度學習時間序列教程
- 如何開發人類活動識別的一維卷積神經網絡模型
- 人類活動識別的深度學習模型
- 如何評估人類活動識別的機器學習算法
- 時間序列預測的多層感知器網絡探索性配置
- 比較經典和機器學習方法進行時間序列預測的結果
- 如何通過深度學習快速獲得時間序列預測的結果
- 如何利用 Python 處理序列預測問題中的缺失時間步長
- 如何建立預測大氣污染日的概率預測模型
- 如何開發一種熟練的機器學習時間序列預測模型
- 如何構建家庭用電自回歸預測模型
- 如何開發多步空氣污染時間序列預測的自回歸預測模型
- 如何制定多站點多元空氣污染時間序列預測的基線預測
- 如何開發時間序列預測的卷積神經網絡模型
- 如何開發卷積神經網絡用于多步時間序列預測
- 如何開發單變量時間序列預測的深度學習模型
- 如何開發 LSTM 模型用于家庭用電的多步時間序列預測
- 如何開發 LSTM 模型進行時間序列預測
- 如何開發多元多步空氣污染時間序列預測的機器學習模型
- 如何開發多層感知器模型進行時間序列預測
- 如何開發人類活動識別時間序列分類的 RNN 模型
- 如何開始深度學習的時間序列預測(7 天迷你課程)
- 如何網格搜索深度學習模型進行時間序列預測
- 如何對單變量時間序列預測的網格搜索樸素方法
- 如何在 Python 中搜索 SARIMA 模型超參數用于時間序列預測
- 如何在 Python 中進行時間序列預測的網格搜索三次指數平滑
- 一個標準的人類活動識別問題的溫和介紹
- 如何加載和探索家庭用電數據
- 如何加載,可視化和探索復雜的多變量多步時間序列預測數據集
- 如何從智能手機數據模擬人類活動
- 如何根據環境因素預測房間占用率
- 如何使用腦波預測人眼是開放還是閉合
- 如何在 Python 中擴展長短期內存網絡的數據
- 如何使用 TimeseriesGenerator 進行 Keras 中的時間序列預測
- 基于機器學習算法的室內運動時間序列分類
- 用于時間序列預測的狀態 LSTM 在線學習的不穩定性
- 用于罕見事件時間序列預測的 LSTM 模型體系結構
- 用于時間序列預測的 4 種通用機器學習數據變換
- Python 中長短期記憶網絡的多步時間序列預測
- 家庭用電機器學習的多步時間序列預測
- Keras 中 LSTM 的多變量時間序列預測
- 如何開發和評估樸素的家庭用電量預測方法
- 如何為長短期記憶網絡準備單變量時間序列數據
- 循環神經網絡在時間序列預測中的應用
- 如何在 Python 中使用差異變換刪除趨勢和季節性
- 如何在 LSTM 中種子狀態用于 Python 中的時間序列預測
- 使用 Python 進行時間序列預測的有狀態和無狀態 LSTM
- 長短時記憶網絡在時間序列預測中的適用性
- 時間序列預測問題的分類
- Python 中長短期記憶網絡的時間序列預測
- 基于 Keras 的 Python 中 LSTM 循環神經網絡的時間序列預測
- Keras 中深度學習的時間序列預測
- 如何用 Keras 調整 LSTM 超參數進行時間序列預測
- 如何在時間序列預測訓練期間更新 LSTM 網絡
- 如何使用 LSTM 網絡的 Dropout 進行時間序列預測
- 如何使用 LSTM 網絡中的特征進行時間序列預測
- 如何在 LSTM 網絡中使用時間序列進行時間序列預測
- 如何利用 LSTM 網絡進行權重正則化進行時間序列預測
- Machine Learning Mastery 線性代數教程
- 機器學習數學符號的基礎知識
- 用 NumPy 陣列輕松介紹廣播
- 如何從 Python 中的 Scratch 計算主成分分析(PCA)
- 用于編碼器審查的計算線性代數
- 10 機器學習中的線性代數示例
- 線性代數的溫和介紹
- 用 NumPy 輕松介紹 Python 中的 N 維數組
- 機器學習向量的溫和介紹
- 如何在 Python 中為機器學習索引,切片和重塑 NumPy 數組
- 機器學習的矩陣和矩陣算法簡介
- 溫和地介紹機器學習的特征分解,特征值和特征向量
- NumPy 對預期價值,方差和協方差的簡要介紹
- 機器學習矩陣分解的溫和介紹
- 用 NumPy 輕松介紹機器學習的張量
- 用于機器學習的線性代數中的矩陣類型簡介
- 用于機器學習的線性代數備忘單
- 線性代數的深度學習
- 用于機器學習的線性代數(7 天迷你課程)
- 機器學習的線性代數
- 機器學習矩陣運算的溫和介紹
- 線性代數評論沒有廢話指南
- 學習機器學習線性代數的主要資源
- 淺談機器學習的奇異值分解
- 如何用線性代數求解線性回歸
- 用于機器學習的稀疏矩陣的溫和介紹
- 機器學習中向量規范的溫和介紹
- 學習線性代數用于機器學習的 5 個理由
- Machine Learning Mastery LSTM 教程
- Keras中長短期記憶模型的5步生命周期
- 長短時記憶循環神經網絡的注意事項
- CNN長短期記憶網絡
- 逆向神經網絡中的深度學習速成課程
- 可變長度輸入序列的數據準備
- 如何用Keras開發用于Python序列分類的雙向LSTM
- 如何開發Keras序列到序列預測的編碼器 - 解碼器模型
- 如何診斷LSTM模型的過度擬合和欠擬合
- 如何開發一種編碼器 - 解碼器模型,注重Keras中的序列到序列預測
- 編碼器 - 解碼器長短期存儲器網絡
- 神經網絡中爆炸梯度的溫和介紹
- 對時間反向傳播的溫和介紹
- 生成長短期記憶網絡的溫和介紹
- 專家對長短期記憶網絡的簡要介紹
- 在序列預測問題上充分利用LSTM
- 編輯器 - 解碼器循環神經網絡全局注意的溫和介紹
- 如何利用長短時記憶循環神經網絡處理很長的序列
- 如何在Python中對一個熱編碼序列數據
- 如何使用編碼器 - 解碼器LSTM來回顯隨機整數序列
- 具有注意力的編碼器 - 解碼器RNN體系結構的實現模式
- 學習使用編碼器解碼器LSTM循環神經網絡添加數字
- 如何學習長短時記憶循環神經網絡回聲隨機整數
- 具有Keras的長短期記憶循環神經網絡的迷你課程
- LSTM自動編碼器的溫和介紹
- 如何用Keras中的長短期記憶模型進行預測
- 用Python中的長短期內存網絡演示內存
- 基于循環神經網絡的序列預測模型的簡要介紹
- 深度學習的循環神經網絡算法之旅
- 如何重塑Keras中長短期存儲網絡的輸入數據
- 了解Keras中LSTM的返回序列和返回狀態之間的差異
- RNN展開的溫和介紹
- 5學習LSTM循環神經網絡的簡單序列預測問題的例子
- 使用序列進行預測
- 堆疊長短期內存網絡
- 什么是教師強制循環神經網絡?
- 如何在Python中使用TimeDistributed Layer for Long Short-Term Memory Networks
- 如何準備Keras中截斷反向傳播的序列預測
- 如何在使用LSTM進行訓練和預測時使用不同的批量大小
- Machine Learning Mastery 機器學習算法教程
- 機器學習算法之旅
- 用于機器學習的裝袋和隨機森林集合算法
- 從頭開始實施機器學習算法的好處
- 更好的樸素貝葉斯:從樸素貝葉斯算法中獲取最多的12個技巧
- 機器學習的提升和AdaBoost
- 選擇機器學習算法:Microsoft Azure的經驗教訓
- 機器學習的分類和回歸樹
- 什么是機器學習中的混淆矩陣
- 如何使用Python從頭開始創建算法測試工具
- 通過創建機器學習算法的目標列表來控制
- 從頭開始停止編碼機器學習算法
- 在實現機器學習算法時,不要從開源代碼開始
- 不要使用隨機猜測作為基線分類器
- 淺談機器學習中的概念漂移
- 溫和介紹機器學習中的偏差 - 方差權衡
- 機器學習的梯度下降
- 機器學習算法如何工作(他們學習輸入到輸出的映射)
- 如何建立機器學習算法的直覺
- 如何實現機器學習算法
- 如何研究機器學習算法行為
- 如何學習機器學習算法
- 如何研究機器學習算法
- 如何研究機器學習算法
- 如何在Python中從頭開始實現反向傳播算法
- 如何用Python從頭開始實現Bagging
- 如何用Python從頭開始實現基線機器學習算法
- 如何在Python中從頭開始實現決策樹算法
- 如何用Python從頭開始實現學習向量量化
- 如何利用Python從頭開始隨機梯度下降實現線性回歸
- 如何利用Python從頭開始隨機梯度下降實現Logistic回歸
- 如何用Python從頭開始實現機器學習算法表現指標
- 如何在Python中從頭開始實現感知器算法
- 如何在Python中從零開始實現隨機森林
- 如何在Python中從頭開始實現重采樣方法
- 如何用Python從頭開始實現簡單線性回歸
- 如何用Python從頭開始實現堆棧泛化(Stacking)
- K-Nearest Neighbors for Machine Learning
- 學習機器學習的向量量化
- 機器學習的線性判別分析
- 機器學習的線性回歸
- 使用梯度下降進行機器學習的線性回歸教程
- 如何在Python中從頭開始加載機器學習數據
- 機器學習的Logistic回歸
- 機器學習的Logistic回歸教程
- 機器學習算法迷你課程
- 如何在Python中從頭開始實現樸素貝葉斯
- 樸素貝葉斯機器學習
- 樸素貝葉斯機器學習教程
- 機器學習算法的過擬合和欠擬合
- 參數化和非參數機器學習算法
- 理解任何機器學習算法的6個問題
- 在機器學習中擁抱隨機性
- 如何使用Python從頭開始擴展機器學習數據
- 機器學習的簡單線性回歸教程
- 有監督和無監督的機器學習算法
- 用于機器學習的支持向量機
- 在沒有數學背景的情況下理解機器學習算法的5種技術
- 最好的機器學習算法
- 教程從頭開始在Python中實現k-Nearest Neighbors
- 通過從零開始實現它們來理解機器學習算法(以及繞過壞代碼的策略)
- 使用隨機森林:在121個數據集上測試179個分類器
- 為什么從零開始實現機器學習算法
- Machine Learning Mastery 機器學習入門教程
- 機器學習入門的四個步驟:初學者入門與實踐的自上而下策略
- 你應該培養的 5 個機器學習領域
- 一種選擇機器學習算法的數據驅動方法
- 機器學習中的分析與數值解
- 應用機器學習是一種精英政治
- 機器學習的基本概念
- 如何成為數據科學家
- 初學者如何在機器學習中弄錯
- 機器學習的最佳編程語言
- 構建機器學習組合
- 機器學習中分類與回歸的區別
- 評估自己作為數據科學家并利用結果建立驚人的數據科學團隊
- 探索 Kaggle 大師的方法論和心態:對 Diogo Ferreira 的采訪
- 擴展機器學習工具并展示掌握
- 通過尋找地標開始機器學習
- 溫和地介紹預測建模
- 通過提供結果在機器學習中獲得夢想的工作
- 如何開始機器學習:自學藍圖
- 開始并在機器學習方面取得進展
- 應用機器學習的 Hello World
- 初學者如何使用小型項目開始機器學習并在 Kaggle 上進行競爭
- 我如何開始機器學習? (簡短版)
- 我是如何開始機器學習的
- 如何在機器學習中取得更好的成績
- 如何從在銀行工作到擔任 Target 的高級數據科學家
- 如何學習任何機器學習工具
- 使用小型目標項目深入了解機器學習工具
- 獲得付費申請機器學習
- 映射機器學習工具的景觀
- 機器學習開發環境
- 機器學習金錢
- 程序員的機器學習
- 機器學習很有意思
- 機器學習是 Kaggle 比賽
- 機器學習現在很受歡迎
- 機器學習掌握方法
- 機器學習很重要
- 機器學習 Q& A:概念漂移,更好的結果和學習更快
- 缺乏自學機器學習的路線圖
- 機器學習很重要
- 快速了解任何機器學習工具(即使您是初學者)
- 機器學習工具
- 找到你的機器學習部落
- 機器學習在一年
- 通過競爭一致的大師 Kaggle
- 5 程序員在機器學習中開始犯錯誤
- 哲學畢業生到機器學習從業者(Brian Thomas 采訪)
- 機器學習入門的實用建議
- 實用機器學習問題
- 使用來自 UCI 機器學習庫的數據集練習機器學習
- 使用秘籍的任何機器學習工具快速啟動
- 程序員可以進入機器學習
- 程序員應該進入機器學習
- 項目焦點:Shashank Singh 的人臉識別
- 項目焦點:使用 Mahout 和 Konstantin Slisenko 進行堆棧交換群集
- 機器學習自學指南
- 4 個自學機器學習項目
- álvaroLemos 如何在數據科學團隊中獲得機器學習實習
- 如何思考機器學習
- 現實世界機器學習問題之旅
- 有關機器學習的有用知識
- 如果我沒有學位怎么辦?
- 如果我不是一個優秀的程序員怎么辦?
- 如果我不擅長數學怎么辦?
- 為什么機器學習算法會處理以前從未見過的數據?
- 是什么阻礙了你的機器學習目標?
- 什么是機器學習?
- 機器學習適合哪里?
- 為什么要進入機器學習?
- 研究對您來說很重要的機器學習問題
- 你這樣做是錯的。為什么機器學習不必如此困難
- Machine Learning Mastery Sklearn 教程
- Scikit-Learn 的溫和介紹:Python 機器學習庫
- 使用 Python 管道和 scikit-learn 自動化機器學習工作流程
- 如何以及何時使用帶有 scikit-learn 的校準分類模型
- 如何比較 Python 中的機器學習算法與 scikit-learn
- 用于機器學習開發人員的 Python 崩潰課程
- 用 scikit-learn 在 Python 中集成機器學習算法
- 使用重采樣評估 Python 中機器學習算法的表現
- 使用 Scikit-Learn 在 Python 中進行特征選擇
- Python 中機器學習的特征選擇
- 如何使用 scikit-learn 在 Python 中生成測試數據集
- scikit-learn 中的機器學習算法秘籍
- 如何使用 Python 處理丟失的數據
- 如何開始使用 Python 進行機器學習
- 如何使用 Scikit-Learn 在 Python 中加載數據
- Python 中概率評分方法的簡要介紹
- 如何用 Scikit-Learn 調整算法參數
- 如何在 Mac OS X 上安裝 Python 3 環境以進行機器學習和深度學習
- 使用 scikit-learn 進行機器學習簡介
- 從 shell 到一本帶有 Fernando Perez 單一工具的書的 IPython
- 如何使用 Python 3 為機器學習開發創建 Linux 虛擬機
- 如何在 Python 中加載機器學習數據
- 您在 Python 中的第一個機器學習項目循序漸進
- 如何使用 scikit-learn 進行預測
- 用于評估 Python 中機器學習算法的度量標準
- 使用 Pandas 為 Python 中的機器學習準備數據
- 如何使用 Scikit-Learn 為 Python 機器學習準備數據
- 項目焦點:使用 Artem Yankov 在 Python 中進行事件推薦
- 用于機器學習的 Python 生態系統
- Python 是應用機器學習的成長平臺
- Python 機器學習書籍
- Python 機器學習迷你課程
- 使用 Pandas 快速和骯臟的數據分析
- 使用 Scikit-Learn 重新調整 Python 中的機器學習數據
- 如何以及何時使用 ROC 曲線和精確調用曲線進行 Python 分類
- 使用 scikit-learn 在 Python 中保存和加載機器學習模型
- scikit-learn Cookbook 書評
- 如何使用 Anaconda 為機器學習和深度學習設置 Python 環境
- 使用 scikit-learn 在 Python 中進行 Spot-Check 分類機器學習算法
- 如何在 Python 中開發可重復使用的抽樣檢查算法框架
- 使用 scikit-learn 在 Python 中進行 Spot-Check 回歸機器學習算法
- 使用 Python 中的描述性統計來了解您的機器學習數據
- 使用 OpenCV,Python 和模板匹配來播放“哪里是 Waldo?”
- 使用 Pandas 在 Python 中可視化機器學習數據
- Machine Learning Mastery 統計學教程
- 淺談計算正態匯總統計量
- 非參數統計的溫和介紹
- Python中常態測試的溫和介紹
- 淺談Bootstrap方法
- 淺談機器學習的中心極限定理
- 淺談機器學習中的大數定律
- 機器學習的所有統計數據
- 如何計算Python中機器學習結果的Bootstrap置信區間
- 淺談機器學習的Chi-Squared測試
- 機器學習的置信區間
- 隨機化在機器學習中解決混雜變量的作用
- 機器學習中的受控實驗
- 機器學習統計學速成班
- 統計假設檢驗的關鍵值以及如何在Python中計算它們
- 如何在機器學習中談論數據(統計學和計算機科學術語)
- Python中數據可視化方法的簡要介紹
- Python中效果大小度量的溫和介紹
- 估計隨機機器學習算法的實驗重復次數
- 機器學習評估統計的溫和介紹
- 如何計算Python中的非參數秩相關性
- 如何在Python中計算數據的5位數摘要
- 如何在Python中從頭開始編寫學生t檢驗
- 如何在Python中生成隨機數
- 如何轉換數據以更好地擬合正態分布
- 如何使用相關來理解變量之間的關系
- 如何使用統計信息識別數據中的異常值
- 用于Python機器學習的隨機數生成器簡介
- k-fold交叉驗證的溫和介紹
- 如何計算McNemar的比較兩種機器學習量詞的測試
- Python中非參數統計顯著性測試簡介
- 如何在Python中使用參數統計顯著性測試
- 機器學習的預測間隔
- 應用統計學與機器學習的密切關系
- 如何使用置信區間報告分類器表現
- 統計數據分布的簡要介紹
- 15 Python中的統計假設檢驗(備忘單)
- 統計假設檢驗的溫和介紹
- 10如何在機器學習項目中使用統計方法的示例
- Python中統計功效和功耗分析的簡要介紹
- 統計抽樣和重新抽樣的簡要介紹
- 比較機器學習算法的統計顯著性檢驗
- 機器學習中統計容差區間的溫和介紹
- 機器學習統計書籍
- 評估機器學習模型的統計數據
- 機器學習統計(7天迷你課程)
- 用于機器學習的簡明英語統計
- 如何使用統計顯著性檢驗來解釋機器學習結果
- 什么是統計(為什么它在機器學習中很重要)?
- Machine Learning Mastery 時間序列入門教程
- 如何在 Python 中為時間序列預測創建 ARIMA 模型
- 用 Python 進行時間序列預測的自回歸模型
- 如何回溯機器學習模型的時間序列預測
- Python 中基于時間序列數據的基本特征工程
- R 的時間序列預測熱門書籍
- 10 挑戰機器學習時間序列預測問題
- 如何將時間序列轉換為 Python 中的監督學習問題
- 如何將時間序列數據分解為趨勢和季節性
- 如何用 ARCH 和 GARCH 模擬波動率進行時間序列預測
- 如何將時間序列數據集與 Python 區分開來
- Python 中時間序列預測的指數平滑的溫和介紹
- 用 Python 進行時間序列預測的特征選擇
- 淺談自相關和部分自相關
- 時間序列預測的 Box-Jenkins 方法簡介
- 用 Python 簡要介紹時間序列的時間序列預測
- 如何使用 Python 網格搜索 ARIMA 模型超參數
- 如何在 Python 中加載和探索時間序列數據
- 如何使用 Python 對 ARIMA 模型進行手動預測
- 如何用 Python 進行時間序列預測的預測
- 如何使用 Python 中的 ARIMA 進行樣本外預測
- 如何利用 Python 模擬殘差錯誤來糾正時間序列預測
- 使用 Python 進行數據準備,特征工程和時間序列預測的移動平均平滑
- 多步時間序列預測的 4 種策略
- 如何在 Python 中規范化和標準化時間序列數據
- 如何利用 Python 進行時間序列預測的基線預測
- 如何使用 Python 對時間序列預測數據進行功率變換
- 用于時間序列預測的 Python 環境
- 如何重構時間序列預測問題
- 如何使用 Python 重新采樣和插值您的時間序列數據
- 用 Python 編寫 SARIMA 時間序列預測
- 如何在 Python 中保存 ARIMA 時間序列預測模型
- 使用 Python 進行季節性持久性預測
- 基于 ARIMA 的 Python 歷史規模敏感性預測技巧分析
- 簡單的時間序列預測模型進行測試,這樣你就不會欺騙自己
- 標準多變量,多步驟和多站點時間序列預測問題
- 如何使用 Python 檢查時間序列數據是否是固定的
- 使用 Python 進行時間序列數據可視化
- 7 個機器學習的時間序列數據集
- 時間序列預測案例研究與 Python:波士頓每月武裝搶劫案
- Python 的時間序列預測案例研究:巴爾的摩的年度用水量
- 使用 Python 進行時間序列預測研究:法國香檳的月銷售額
- 使用 Python 的置信區間理解時間序列預測不確定性
- 11 Python 中的經典時間序列預測方法(備忘單)
- 使用 Python 進行時間序列預測表現測量
- 使用 Python 7 天迷你課程進行時間序列預測
- 時間序列預測作為監督學習
- 什么是時間序列預測?
- 如何使用 Python 識別和刪除時間序列數據的季節性
- 如何在 Python 中使用和刪除時間序列數據中的趨勢信息
- 如何在 Python 中調整 ARIMA 參數
- 如何用 Python 可視化時間序列殘差預測錯誤
- 白噪聲時間序列與 Python
- 如何通過時間序列預測項目
- Machine Learning Mastery XGBoost 教程
- 通過在 Python 中使用 XGBoost 提前停止來避免過度擬合
- 如何在 Python 中調優 XGBoost 的多線程支持
- 如何配置梯度提升算法
- 在 Python 中使用 XGBoost 進行梯度提升的數據準備
- 如何使用 scikit-learn 在 Python 中開發您的第一個 XGBoost 模型
- 如何在 Python 中使用 XGBoost 評估梯度提升模型
- 在 Python 中使用 XGBoost 的特征重要性和特征選擇
- 淺談機器學習的梯度提升算法
- 應用機器學習的 XGBoost 簡介
- 如何在 macOS 上為 Python 安裝 XGBoost
- 如何在 Python 中使用 XGBoost 保存梯度提升模型
- 從梯度提升開始,比較 165 個數據集上的 13 種算法
- 在 Python 中使用 XGBoost 和 scikit-learn 進行隨機梯度提升
- 如何使用 Amazon Web Services 在云中訓練 XGBoost 模型
- 在 Python 中使用 XGBoost 調整梯度提升的學習率
- 如何在 Python 中使用 XGBoost 調整決策樹的數量和大小
- 如何在 Python 中使用 XGBoost 可視化梯度提升決策樹
- 在 Python 中開始使用 XGBoost 的 7 步迷你課程