# 比較機器學習算法的統計顯著性檢驗
> 原文: [https://machinelearningmastery.com/statistical-significance-tests-for-comparing-machine-learning-algorithms/](https://machinelearningmastery.com/statistical-significance-tests-for-comparing-machine-learning-algorithms/)
比較機器學習方法和選擇最終模型是應用機器學習中的常見操作。
模型通常使用重新采樣方法進行評估,例如k折疊交叉驗證,從中計算并直接比較平均技能分數。雖然簡單,但這種方法可能會產生誤導,因為很難知道平均技能得分之間的差異是真實的還是統計僥幸的結果。
設計統計顯著性檢驗以解決該問題,并且假設它們是從相同分布中抽取而量化觀察技能分數樣本的可能性。如果拒絕這種假設或零假設,則表明技能分數的差異具有統計學意義。
雖然不是萬無一失,但統計假設檢驗可以提高您對解釋的信心以及在模型選擇過程中對結果的呈現。
在本教程中,您將發現選擇統計假設檢驗來比較機器學習模型的重要性和挑戰。
完成本教程后,您將了解:
* 統計假設檢驗有助于比較機器學習模型和選擇最終模型。
* 統計假設檢驗的幼稚應用可能導致誤導性結果。
* 正確使用統計檢驗具有挑戰性,對于使用McNemar檢驗或5×2交叉驗證與修改后的配對Student t檢驗存在一些共識。
讓我們開始吧。
* **更新Oct / 2018** :添加了使用 [McNemar測試](https://machinelearningmastery.com/mcnemars-test-for-machine-learning/)的示例的鏈接。

用于比較機器學習算法的統計顯著性檢驗
照片由[FotografíasdeJavier](https://www.flickr.com/photos/69487670@N04/6351929452/) 拍攝,保留一些權利。
## 教程概述
本教程分為5個部分;他們是:
1. 模型選擇問題
2. 統計假設檢驗
3. 選擇假設檢驗的問題
4. 一些調查結果摘要
5. 建議
## 模型選擇問題
應用機器學習的一個重要部分是模型選擇。
我們可以用最簡單的形式來描述:
> 鑒于對數據集的兩種機器學習方法的評估,您選擇哪種模型?
您選擇具有最佳技能的模型。
也就是說,在對看不見的數據進行預測時估計技能的模型是最佳的。在分類和回歸問題的情況下,這可能分別是最大準確度或最小誤差。
選擇具有最佳技能的模型的挑戰在于確定您可以信任每種模型的估計技能的程度。更普遍:
> 兩種機器學習模型之間的技能差異是真實的,還是由于統計機會?
我們可以使用統計假設檢驗來解決這個問題。
## 統計假設檢驗
通常,用于比較樣本的統計假設檢驗量化了在假設樣本具有相同分布的情況下觀察兩個數據樣本的可能性。
統計檢驗的假設稱為零假設,我們可以計算統計指標并對其進行解釋,以決定是否接受或拒絕原假設。
在基于其估計技能選擇模型的情況下,我們有興趣知道兩個模型之間是否存在實際或統計上顯著的差異。
* 如果測試結果表明沒有足夠的證據拒絕零假設,那么任何觀察到的模型技能差異都可能是由于統計機會。
* 如果測試結果表明有足夠的證據拒絕零假設,則模型技能的任何觀察到的差異可能是由于模型的差異。
測試的結果是概率性的,這意味著,可以正確地解釋結果,并且結果對于類型I或類型II錯誤是錯誤的。簡而言之,假陽性或假陰性發現。
通過統計顯著性檢驗比較機器學習模型會產生一些預期,反過來會影響可以使用的統計檢驗類型;例如:
* **技能評估**。必須選擇特定的模型技能度量。這可能是分類準確度(一個比例)或平均絕對誤差(匯總統計量),這將限制可以使用的測試類型。
* **重復估計**。需要一個技能分數樣本來計算統計數據。對相同或不同數據重復訓練和測試給定模型將影響可以使用的測試類型。
* **估算分布**。技能分數估計的樣本將具有分布,可能是高斯分布或者可能不是。這將確定是否可以使用參數測試或非參數測試。
* **中心趨勢**。通常使用諸如平均值或中值的匯總統計來描述和比較模型技能,這取決于技能分數的分布。測試可能會也可能不會直接考慮到這一點。
統計檢驗的結果通常是檢驗統計量和p值,兩者都可以在結果的呈現中被解釋和使用,以便量化模型之間差異的置信水平或顯著性。這允許更強的聲明作為模型選擇的一部分而不是使用統計假設檢驗。
鑒于使用統計假設檢驗似乎是模型選擇的一部分,您如何選擇適合您特定用例的測試?
## 選擇假設檢驗的問題
讓我們看一個用于評估和比較均衡二元分類問題的分類器的常見示例。
通常的做法是使用分類準確度評估分類方法,使用10倍交叉驗證評估每個模型,假設10個模型技能估計樣本的高斯分布,并使用樣本的平均值作為總結模特的技巧。
我們可以要求使用此過程評估的每個分類器通過10倍交叉驗證在完全相同的數據集分割上進行評估。這將給出兩個分類器之間匹配的配對測量的樣本,因為每個分類器在相同的10個測試集上進行評估。
然后我們可以選擇并使用配對的[學生t檢驗](https://en.wikipedia.org/wiki/Student%27s_t-test)來檢查兩個模型之間平均準確度的差異是否具有統計學意義,例如拒絕假設兩個樣本具有相同分布的零假設。
事實上,這是使用這種方法將分類器與可能數百篇已發表論文進行比較的常用方法。
問題是,配對學生t檢驗的關鍵假設已被違反。
即,每個樣本中的觀察結果不是獨立的。作為k折交叉驗證程序的一部分,將在訓練數據集(k-1)中使用給定的觀察。這意味著估計的技能分數是依賴的,而不是獨立的,反過來,測試中的t統計量的計算將與誤差統計和p值的任何解釋一起誤導。
這種觀察需要仔細了解所使用的重采樣方法,在這種情況下是k次交叉驗證,以及所選假設檢驗的期望,在這種情況下是配對學生t檢驗。沒有這個背景,測試看起來是合適的,結果將被計算和解釋,一切都會好看。
不幸的是,在應用機器學習中為模型選擇選擇適當的統計假設檢驗比首次出現時更具挑戰性。幸運的是,越來越多的研究有助于指出樸素方法的缺陷,并提出修正和替代方法。
## 一些調查結果摘要
在本節中,我們來看一些關于機器學習中模型選擇的適當統計顯著性檢驗選擇的研究。
### 使用McNemar的測試或5×2交叉驗證
也許關于這一主題的開創性工作是1998年題為“[用于比較監督分類學習算法](http://ieeexplore.ieee.org/document/6790639/)的近似統計檢驗”的論文,作者是Thomas Dietterich。
這是關于該主題的優秀論文和推薦閱讀。它首先介紹了一個很好的框架,用于在機器學習項目中考慮可能需要進行統計假設檢驗的點,討論與比較分類器機器學習方法相關的常見違反統計檢驗的期望,以及對方法的經驗評估的結束確認調查結果。
> 本文回顧了五種近似的統計檢驗,用于確定一種學習算法是否優于另一種學習算法。
本文中統計假設檢驗的選擇和經驗評估的重點是I型誤差或誤報的校準。也就是說,選擇最小化在沒有這種差異時建議顯著差異的情況的測試。
本文中有許多重要發現。
第一個發現是,對于通過訓練數據集的隨機重采樣估計的技能結果,使用配對學生t檢驗絕對不應該進行。
> ......我們可以自信地得出結論,不應該采用重采樣t檢驗。
在隨機重采樣的情況下和在k折交叉驗證的情況下(如上所述),違反了配對t檢驗的假設。然而,在k折交叉驗證的情況下,t檢驗將是樂觀的,導致I類錯誤更高,但只有適度的II類錯誤。這意味著這種組合可用于避免類型II錯誤比屈服于類型I錯誤更重要的情況。
> 10倍交叉驗證t檢驗具有高I型誤差。然而,它也具有高功率,因此,可以推薦在II類錯誤(未能檢測到算法之間的真正差異)更重要的情況下。
Dietterich建議 [McNemar的統計假設檢驗](https://machinelearningmastery.com/mcnemars-test-for-machine-learning/)用于數據量有限且每種算法只能評估一次的情況。
McNemar的測試類似于Chi-Squared測試,在這種情況下用于確定算法的列聯表中觀察到的比例的差異是否與預期的比例顯著不同。對于需要數天或數周訓練的大型深度學習神經網絡,這是一個有用的發現。
> 我們的實驗引導我們推薦McNemar的測試,適用于學習算法只能運行一次的情況。
Dietterich還推薦了他自己設計的重新取樣方法,稱為5×2交叉驗證,涉及5次重復的2倍[交叉驗證](https://en.wikipedia.org/wiki/Cross-validation_(statistics))。
選擇兩個折疊以確保每個觀察僅出現在訓練或測試數據集中以用于模型技能的單個估計。在結果上使用配對學生t檢驗,更新以更好地反映有限的自由度,因為估計的技能分數之間存在依賴關系。
> 我們的實驗引導我們推薦5 x 2cv t測試,適用于學習算法足夠高效運行十次的情況
### 5×2交叉驗證的改進
自該論文發表以來,使用McNemar測試或5×2交叉驗證已成為20年來大部分時間的主要建議。
盡管如此,已經進行了進一步的改進,以更好地糾正配對學生t檢驗,以避免重復k-交叉驗證違反獨立性假設。
其中兩篇重要論文包括:
Claude Nadeau和Yoshua Bengio在2003年題為“[推斷誤差](https://link.springer.com/article/10.1023/A:1024068626366)”的論文中提出了進一步的修正。這是一張濃密的紙,不適合膽小的人。
> 該分析允許我們構建兩個方差估計,其考慮了由于選擇訓練集而導致的可變性以及測試示例的選擇。其中一個提出的估計看起來類似于cv方法(Dietterich,1998),并且專門設計用于高估方差以產生保守推理。
Remco Bouckaert和Eibe Frank在其2004年題為“[評估比較學習算法的重要性測試的可復制性](https://link.springer.com/chapter/10.1007/978-3-540-24775-3_3)”的論文中采取了不同的觀點,并認為復制結果的能力比I型或II型錯誤更重要。
> 在本文中,我們認為測試的可復制性也很重要。我們說如果測試結果強烈依賴于用于執行它的數據的特定隨機分區,那么測試具有低可復制性
令人驚訝的是,他們建議使用100次隨機重采樣或10×10倍交叉驗證與Nadeau和Bengio校正配對Student-t測試,以實現良好的可復制性。
后一種方法在Ian Witten和Eibe Frank的書以及他們的開源數據挖掘平臺Weka中被推薦,將Nadeau和Bengio校正稱為“_校正的重采樣t檢驗_”。
> 已經提出了對標準t檢驗的各種修改來規避這個問題,所有這些修改都是啟發式的并且缺乏合理的理論依據。在實踐中似乎運行良好的是校正的重采樣t檢驗。 [...]相同的修改統計數據可用于重復交叉驗證,這只是重復保持的特殊情況,其中一個交叉驗證的各個測試集不重疊。
- 第159頁,第5章,可信度:評估已經學到的東西,[數據挖掘:實用機器學習工具和技術](https://amzn.to/2GgeHch),第三版,2011。
## 建議
在應用機器學習中選擇模型選擇的統計顯著性檢驗時,沒有銀子彈。
讓我們看看您可以在機器學習項目中使用的五種方法來比較分類器。
### 1.獨立數據樣本
如果您有接近無限的數據,請收集k個單獨的訓練和測試數據集,以計算每種方法的10個真正獨立的技能分數。
然后,您可以正確應用配對學生的t檢驗。這是最不可能的,因為我們經常處理小數據樣本。
> ...假設存在基本上無限的數據,以便可以使用正確大小的幾個獨立數據集。實際上,通常只有一個有限大小的數據集。可以做些什么?
- 第158頁,第5章,可信度:評估已經學到的東西,[數據挖掘:實用機器學習工具和技術](https://amzn.to/2GgeHch),第三版,2011。
### 2.接受10倍CV的問題
可以使用樸素的10倍交叉驗證與未修改的配對學生t檢驗。
它具有相對于其他方法的良好可重復性和適度的II型錯誤,但已知具有高I型錯誤。
> 實驗還建議在解釋10倍交叉驗證t檢驗的結果時要謹慎。該測試具有升高的I型錯誤概率(高達目標水平的兩倍),盡管它不像重采樣t檢驗的問題那么嚴重。
- [用于比較監督分類學習算法的近似統計檢驗](http://ieeexplore.ieee.org/document/6790639/),1998。
這是一個選項,但推薦非常弱。
### 3.使用McNemar的測試或5×2 CV
McNemar測試單次分類準確性結果的長達20年的建議和5×2倍交叉驗證,并在一般情況下使用修改后的配對Student t檢驗。
此外,Nadeau和Bengio對測試統計的進一步校正可以與Weka的開發者推薦的5×2倍交叉驗證或10×10倍交叉驗證一起使用。
使用修改的t統計量的一個挑戰是沒有現成的實現(例如在SciPy中),需要使用第三方代碼以及這帶來的風險。您可能必須自己實施。
選擇統計方法的可用性和復雜性是一個重要的考慮因素,Gitte Vanwinckelen和Hendrik Blockeel在其2012年題為“[估計模型準確性與重復交叉驗證](https://lirias.kuleuven.be/handle/123456789/346385)”的論文中表示:
> 雖然這些方法經過精心設計,并且可以通過多種方式改進以前的方法,但它們與以前的方法具有相同的風險,即方法越復雜,研究人員使用它的風險就越高。 ,或錯誤地解釋結果。
我有一個在這里使用McNemar測試的例子:
* [如何計算McNemar的比較兩臺機器學習分類器的測試](https://machinelearningmastery.com/mcnemars-test-for-machine-learning/)
### 4.使用非參數配對測試
我們可以使用非參數測試來做出更少的假設,例如不假設技能分數的分布是高斯分布。
一個例子是 [Wilcoxon符號秩檢驗](https://en.wikipedia.org/wiki/Wilcoxon_signed-rank_test),它是配對學生t檢驗的非參數版本。該測試具有比配對t檢驗更少的統計功效,盡管在違反t檢驗的期望時更多功率,例如獨立性。
這種統計假設檢驗被推薦用于比較Janez Demsar在其2006年論文“多重數據集中的分類器的統計比較”中的不同數據集的算法。
> 因此,我們建議使用Wilcoxon測試,除非滿足t檢驗假設,因為我們有許多數據集,或者因為我們有理由相信跨數據集的表現測量值是正常分布的。
盡管該測試是非參數的,但它仍假設每個樣本內的觀察是獨立的(例如iid),并且使用k倍交叉驗證將產生依賴樣本并違反該假設。
### 5.使用估算統計
可以計算估計統計量而不是統計假設檢驗,例如置信區間。考慮到評估模型的重采樣方法,這些將遭受類似的問題,其中違反了獨立性的假設。
Tom Mitchell在其1997年的書中提出了類似的建議,建議將統計假設檢驗的結果作為啟發式估計,并尋求關于模型技能估計的置信區間:
> 總而言之,沒有一種基于有限數據的比較學習方法的程序滿足我們想要的所有約束。明智的是要記住,當可用數據有限時,統計模型很少完全符合測試學習算法的實際約束。然而,它們確實提供了近似置信區間,這對于解釋學習方法的實驗比較有很大幫助。
- 第150頁,第5章,評估假設,[機器學習](https://amzn.to/2pE6l83),1997。
諸如自舉之類的統計方法可用于計算可防御的非參數置信區間,其可用于呈現結果和比較分類器。這是一種簡單而有效的方法,您可以隨時使用,我建議一般。
> 實際上,置信區間已經獲得了對自助區域中任何主題的最理論研究。
- 第321頁, [Bootstrap簡介](https://amzn.to/2ISXPKe),1994。
## 擴展
本節列出了一些擴展您可能希望探索的教程的想法。
* 查找并列出三篇錯誤使用未經修改的配對學生t檢驗的研究論文,以比較和選擇機器學習模型。
* 總結在Thomas Dietterich 1998年論文中提出的機器學習項目中使用統計假設檢驗的框架。
* 查找并列出三篇正確使用McNemar測試或5×2交叉驗證進行比較并選擇機器學習模型的研究論文。
如果你探索任何這些擴展,我很想知道。
## 進一步閱讀
如果您希望深入了解,本節將提供有關該主題的更多資源。
### 文件
* [用于比較監督分類學習算法的近似統計檢驗](http://ieeexplore.ieee.org/document/6790639/),1998。
* [推廣錯誤的推斷](https://link.springer.com/article/10.1023/A:1024068626366),2003。
* [評估用于比較學習算法的重要性測試的可復制性](https://link.springer.com/chapter/10.1007/978-3-540-24775-3_3),2004。
* [關于通過重復交叉驗證估算模型精度](https://lirias.kuleuven.be/handle/123456789/346385),2012。
* [多數據集上分類器的統計比較](http://www.jmlr.org/papers/v7/demsar06a.html),2006。
### 圖書
* 第5章,評估假設,[機器學習](https://amzn.to/2pE6l83),1997。
* 第5章,可信度:評估已經學到的東西,[數據挖掘:實用機器學習工具和技術](https://amzn.to/2GgeHch),第三版,2011。
* [引導程序簡介](https://amzn.to/2ISXPKe),1994。
### 用品
* [維基百科上的學生t檢驗](https://en.wikipedia.org/wiki/Student%27s_t-test)
* [維基百科](https://en.wikipedia.org/wiki/Cross-validation_(statistics))的交叉驗證(統計)
* [McNemar對維基百科的測試](https://en.wikipedia.org/wiki/McNemar%27s_test)
* [Wilcoxon對維基百科的簽名等級測試](https://en.wikipedia.org/wiki/Wilcoxon_signed-rank_test)
### 討論
* [對于模型選擇/比較,我應該使用哪種測試?](https://stats.stackexchange.com/questions/217466/for-model-selection-comparison-what-kind-of-test-should-i-use)
* [如何進行假設檢驗以比較不同的分類器](https://stats.stackexchange.com/questions/89064/how-to-perform-hypothesis-testing-for-comparing-different-classifiers)
* [Wilcoxon秩和檢驗方法](https://stats.stackexchange.com/questions/93369/wilcoxon-rank-sum-test-methodology)
* [如何選擇t檢驗或非參數檢驗,例如小樣本中的Wilcoxon](https://stats.stackexchange.com/questions/121852/how-to-choose-between-t-test-or-non-parametric-test-e-g-wilcoxon-in-small-sampl)
## 摘要
在本教程中,您發現了選擇統計假設檢驗來比較機器學習模型的重要性和挑戰。
具體來說,你學到了:
* 統計假設檢驗有助于比較機器學習模型和選擇最終模型。
* 統計假設檢驗的幼稚應用可能導致誤導性結果。
* 正確使用統計檢驗具有挑戰性,對于使用McNemar檢驗或5×2交叉驗證與修改后的配對Student t檢驗存在一些共識。
你有任何問題嗎?
在下面的評論中提出您的問題,我會盡力回答。
- Machine Learning Mastery 應用機器學習教程
- 5競爭機器學習的好處
- 過度擬合的簡單直覺,或者為什么測試訓練數據是一個壞主意
- 特征選擇簡介
- 應用機器學習作為一個搜索問題的溫和介紹
- 為什么應用機器學習很難
- 為什么我的結果不如我想的那么好?你可能過度擬合了
- 用ROC曲線評估和比較分類器表現
- BigML評論:發現本機學習即服務平臺的聰明功能
- BigML教程:開發您的第一個決策樹并進行預測
- 構建生產機器學習基礎設施
- 分類準確性不夠:可以使用更多表現測量
- 一種預測模型的巧妙應用
- 機器學習項目中常見的陷阱
- 數據清理:將凌亂的數據轉換為整潔的數據
- 機器學習中的數據泄漏
- 數據,學習和建模
- 數據管理至關重要以及為什么需要認真對待它
- 將預測模型部署到生產中
- 參數和超參數之間有什么區別?
- 測試和驗證數據集之間有什么區別?
- 發現特征工程,如何設計特征以及如何獲得它
- 如何開始使用Kaggle
- 超越預測
- 如何在評估機器學習算法時選擇正確的測試選項
- 如何定義機器學習問題
- 如何評估機器學習算法
- 如何獲得基線結果及其重要性
- 如何充分利用機器學習數據
- 如何識別數據中的異常值
- 如何提高機器學習效果
- 如何在競爭機器學習中踢屁股
- 如何知道您的機器學習模型是否具有良好的表現
- 如何布局和管理您的機器學習項目
- 如何為機器學習準備數據
- 如何減少最終機器學習模型中的方差
- 如何使用機器學習結果
- 如何解決像數據科學家這樣的問題
- 通過數據預處理提高模型精度
- 處理機器學習的大數據文件的7種方法
- 建立機器學習系統的經驗教訓
- 如何使用機器學習清單可靠地獲得準確的預測(即使您是初學者)
- 機器學習模型運行期間要做什么
- 機器學習表現改進備忘單
- 來自世界級從業者的機器學習技巧:Phil Brierley
- 模型預測精度與機器學習中的解釋
- 競爭機器學習的模型選擇技巧
- 機器學習需要多少訓練數據?
- 如何系統地規劃和運行機器學習實驗
- 應用機器學習過程
- 默認情況下可重現的機器學習結果
- 10個實踐應用機器學習的標準數據集
- 簡單的三步法到最佳機器學習算法
- 打擊機器學習數據集中不平衡類的8種策略
- 模型表現不匹配問題(以及如何處理)
- 黑箱機器學習的誘惑陷阱
- 如何培養最終的機器學習模型
- 使用探索性數據分析了解您的問題并獲得更好的結果
- 什么是數據挖掘和KDD
- 為什么One-Hot在機器學習中編碼數據?
- 為什么你應該在你的機器學習問題上進行抽樣檢查算法
- 所以,你正在研究機器學習問題......
- Machine Learning Mastery Keras 深度學習教程
- Keras 中神經網絡模型的 5 步生命周期
- 在 Python 迷你課程中應用深度學習
- Keras 深度學習庫的二元分類教程
- 如何用 Keras 構建多層感知器神經網絡模型
- 如何在 Keras 中檢查深度學習模型
- 10 個用于 Amazon Web Services 深度學習的命令行秘籍
- 機器學習卷積神經網絡的速成課程
- 如何在 Python 中使用 Keras 進行深度學習的度量
- 深度學習書籍
- 深度學習課程
- 你所知道的深度學習是一種謊言
- 如何設置 Amazon AWS EC2 GPU 以訓練 Keras 深度學習模型(分步)
- 神經網絡中批量和迭代之間的區別是什么?
- 在 Keras 展示深度學習模型訓練歷史
- 基于 Keras 的深度學習模型中的dropout正則化
- 評估 Keras 中深度學習模型的表現
- 如何評價深度學習模型的技巧
- 小批量梯度下降的簡要介紹以及如何配置批量大小
- 在 Keras 中獲得深度學習幫助的 9 種方法
- 如何使用 Keras 在 Python 中網格搜索深度學習模型的超參數
- 用 Keras 在 Python 中使用卷積神經網絡進行手寫數字識別
- 如何用 Keras 進行預測
- 用 Keras 進行深度學習的圖像增強
- 8 個深度學習的鼓舞人心的應用
- Python 深度學習庫 Keras 簡介
- Python 深度學習庫 TensorFlow 簡介
- Python 深度學習庫 Theano 簡介
- 如何使用 Keras 函數式 API 進行深度學習
- Keras 深度學習庫的多類分類教程
- 多層感知器神經網絡速成課程
- 基于卷積神經網絡的 Keras 深度學習庫中的目標識別
- 流行的深度學習庫
- 用深度學習預測電影評論的情感
- Python 中的 Keras 深度學習庫的回歸教程
- 如何使用 Keras 獲得可重現的結果
- 如何在 Linux 服務器上運行深度學習實驗
- 保存并加載您的 Keras 深度學習模型
- 用 Keras 逐步開發 Python 中的第一個神經網絡
- 用 Keras 理解 Python 中的有狀態 LSTM 循環神經網絡
- 在 Python 中使用 Keras 深度學習模型和 Scikit-Learn
- 如何使用預訓練的 VGG 模型對照片中的物體進行分類
- 在 Python 和 Keras 中對深度學習模型使用學習率調度
- 如何在 Keras 中可視化深度學習神經網絡模型
- 什么是深度學習?
- 何時使用 MLP,CNN 和 RNN 神經網絡
- 為什么用隨機權重初始化神經網絡?
- Machine Learning Mastery 深度學習 NLP 教程
- 深度學習在自然語言處理中的 7 個應用
- 如何實現自然語言處理的波束搜索解碼器
- 深度學習文檔分類的最佳實踐
- 關于自然語言處理的熱門書籍
- 在 Python 中計算文本 BLEU 分數的溫和介紹
- 使用編碼器 - 解碼器模型的用于字幕生成的注入和合并架構
- 如何用 Python 清理機器學習的文本
- 如何配置神經機器翻譯的編碼器 - 解碼器模型
- 如何開始深度學習自然語言處理(7 天迷你課程)
- 自然語言處理的數據集
- 如何開發一種深度學習的詞袋模型來預測電影評論情感
- 深度學習字幕生成模型的溫和介紹
- 如何在 Keras 中定義神經機器翻譯的編碼器 - 解碼器序列 - 序列模型
- 如何利用小實驗在 Keras 中開發字幕生成模型
- 如何從頭開發深度學習圖片標題生成器
- 如何在 Keras 中開發基于字符的神經語言模型
- 如何開發用于情感分析的 N-gram 多通道卷積神經網絡
- 如何從零開始開發神經機器翻譯系統
- 如何在 Python 中用 Keras 開發基于單詞的神經語言模型
- 如何開發一種預測電影評論情感的詞嵌入模型
- 如何使用 Gensim 在 Python 中開發詞嵌入
- 用于文本摘要的編碼器 - 解碼器深度學習模型
- Keras 中文本摘要的編碼器 - 解碼器模型
- 用于神經機器翻譯的編碼器 - 解碼器循環神經網絡模型
- 淺談詞袋模型
- 文本摘要的溫和介紹
- 編碼器 - 解碼器循環神經網絡中的注意力如何工作
- 如何利用深度學習自動生成照片的文本描述
- 如何開發一個單詞級神經語言模型并用它來生成文本
- 淺談神經機器翻譯
- 什么是自然語言處理?
- 牛津自然語言處理深度學習課程
- 如何為機器翻譯準備法語到英語的數據集
- 如何為情感分析準備電影評論數據
- 如何為文本摘要準備新聞文章
- 如何準備照片標題數據集以訓練深度學習模型
- 如何使用 Keras 為深度學習準備文本數據
- 如何使用 scikit-learn 為機器學習準備文本數據
- 自然語言處理神經網絡模型入門
- 對自然語言處理的深度學習的承諾
- 在 Python 中用 Keras 進行 LSTM 循環神經網絡的序列分類
- 斯坦福自然語言處理深度學習課程評價
- 統計語言建模和神經語言模型的簡要介紹
- 使用 Keras 在 Python 中進行 LSTM 循環神經網絡的文本生成
- 淺談機器學習中的轉換
- 如何使用 Keras 將詞嵌入層用于深度學習
- 什么是用于文本的詞嵌入
- Machine Learning Mastery 深度學習時間序列教程
- 如何開發人類活動識別的一維卷積神經網絡模型
- 人類活動識別的深度學習模型
- 如何評估人類活動識別的機器學習算法
- 時間序列預測的多層感知器網絡探索性配置
- 比較經典和機器學習方法進行時間序列預測的結果
- 如何通過深度學習快速獲得時間序列預測的結果
- 如何利用 Python 處理序列預測問題中的缺失時間步長
- 如何建立預測大氣污染日的概率預測模型
- 如何開發一種熟練的機器學習時間序列預測模型
- 如何構建家庭用電自回歸預測模型
- 如何開發多步空氣污染時間序列預測的自回歸預測模型
- 如何制定多站點多元空氣污染時間序列預測的基線預測
- 如何開發時間序列預測的卷積神經網絡模型
- 如何開發卷積神經網絡用于多步時間序列預測
- 如何開發單變量時間序列預測的深度學習模型
- 如何開發 LSTM 模型用于家庭用電的多步時間序列預測
- 如何開發 LSTM 模型進行時間序列預測
- 如何開發多元多步空氣污染時間序列預測的機器學習模型
- 如何開發多層感知器模型進行時間序列預測
- 如何開發人類活動識別時間序列分類的 RNN 模型
- 如何開始深度學習的時間序列預測(7 天迷你課程)
- 如何網格搜索深度學習模型進行時間序列預測
- 如何對單變量時間序列預測的網格搜索樸素方法
- 如何在 Python 中搜索 SARIMA 模型超參數用于時間序列預測
- 如何在 Python 中進行時間序列預測的網格搜索三次指數平滑
- 一個標準的人類活動識別問題的溫和介紹
- 如何加載和探索家庭用電數據
- 如何加載,可視化和探索復雜的多變量多步時間序列預測數據集
- 如何從智能手機數據模擬人類活動
- 如何根據環境因素預測房間占用率
- 如何使用腦波預測人眼是開放還是閉合
- 如何在 Python 中擴展長短期內存網絡的數據
- 如何使用 TimeseriesGenerator 進行 Keras 中的時間序列預測
- 基于機器學習算法的室內運動時間序列分類
- 用于時間序列預測的狀態 LSTM 在線學習的不穩定性
- 用于罕見事件時間序列預測的 LSTM 模型體系結構
- 用于時間序列預測的 4 種通用機器學習數據變換
- Python 中長短期記憶網絡的多步時間序列預測
- 家庭用電機器學習的多步時間序列預測
- Keras 中 LSTM 的多變量時間序列預測
- 如何開發和評估樸素的家庭用電量預測方法
- 如何為長短期記憶網絡準備單變量時間序列數據
- 循環神經網絡在時間序列預測中的應用
- 如何在 Python 中使用差異變換刪除趨勢和季節性
- 如何在 LSTM 中種子狀態用于 Python 中的時間序列預測
- 使用 Python 進行時間序列預測的有狀態和無狀態 LSTM
- 長短時記憶網絡在時間序列預測中的適用性
- 時間序列預測問題的分類
- Python 中長短期記憶網絡的時間序列預測
- 基于 Keras 的 Python 中 LSTM 循環神經網絡的時間序列預測
- Keras 中深度學習的時間序列預測
- 如何用 Keras 調整 LSTM 超參數進行時間序列預測
- 如何在時間序列預測訓練期間更新 LSTM 網絡
- 如何使用 LSTM 網絡的 Dropout 進行時間序列預測
- 如何使用 LSTM 網絡中的特征進行時間序列預測
- 如何在 LSTM 網絡中使用時間序列進行時間序列預測
- 如何利用 LSTM 網絡進行權重正則化進行時間序列預測
- Machine Learning Mastery 線性代數教程
- 機器學習數學符號的基礎知識
- 用 NumPy 陣列輕松介紹廣播
- 如何從 Python 中的 Scratch 計算主成分分析(PCA)
- 用于編碼器審查的計算線性代數
- 10 機器學習中的線性代數示例
- 線性代數的溫和介紹
- 用 NumPy 輕松介紹 Python 中的 N 維數組
- 機器學習向量的溫和介紹
- 如何在 Python 中為機器學習索引,切片和重塑 NumPy 數組
- 機器學習的矩陣和矩陣算法簡介
- 溫和地介紹機器學習的特征分解,特征值和特征向量
- NumPy 對預期價值,方差和協方差的簡要介紹
- 機器學習矩陣分解的溫和介紹
- 用 NumPy 輕松介紹機器學習的張量
- 用于機器學習的線性代數中的矩陣類型簡介
- 用于機器學習的線性代數備忘單
- 線性代數的深度學習
- 用于機器學習的線性代數(7 天迷你課程)
- 機器學習的線性代數
- 機器學習矩陣運算的溫和介紹
- 線性代數評論沒有廢話指南
- 學習機器學習線性代數的主要資源
- 淺談機器學習的奇異值分解
- 如何用線性代數求解線性回歸
- 用于機器學習的稀疏矩陣的溫和介紹
- 機器學習中向量規范的溫和介紹
- 學習線性代數用于機器學習的 5 個理由
- Machine Learning Mastery LSTM 教程
- Keras中長短期記憶模型的5步生命周期
- 長短時記憶循環神經網絡的注意事項
- CNN長短期記憶網絡
- 逆向神經網絡中的深度學習速成課程
- 可變長度輸入序列的數據準備
- 如何用Keras開發用于Python序列分類的雙向LSTM
- 如何開發Keras序列到序列預測的編碼器 - 解碼器模型
- 如何診斷LSTM模型的過度擬合和欠擬合
- 如何開發一種編碼器 - 解碼器模型,注重Keras中的序列到序列預測
- 編碼器 - 解碼器長短期存儲器網絡
- 神經網絡中爆炸梯度的溫和介紹
- 對時間反向傳播的溫和介紹
- 生成長短期記憶網絡的溫和介紹
- 專家對長短期記憶網絡的簡要介紹
- 在序列預測問題上充分利用LSTM
- 編輯器 - 解碼器循環神經網絡全局注意的溫和介紹
- 如何利用長短時記憶循環神經網絡處理很長的序列
- 如何在Python中對一個熱編碼序列數據
- 如何使用編碼器 - 解碼器LSTM來回顯隨機整數序列
- 具有注意力的編碼器 - 解碼器RNN體系結構的實現模式
- 學習使用編碼器解碼器LSTM循環神經網絡添加數字
- 如何學習長短時記憶循環神經網絡回聲隨機整數
- 具有Keras的長短期記憶循環神經網絡的迷你課程
- LSTM自動編碼器的溫和介紹
- 如何用Keras中的長短期記憶模型進行預測
- 用Python中的長短期內存網絡演示內存
- 基于循環神經網絡的序列預測模型的簡要介紹
- 深度學習的循環神經網絡算法之旅
- 如何重塑Keras中長短期存儲網絡的輸入數據
- 了解Keras中LSTM的返回序列和返回狀態之間的差異
- RNN展開的溫和介紹
- 5學習LSTM循環神經網絡的簡單序列預測問題的例子
- 使用序列進行預測
- 堆疊長短期內存網絡
- 什么是教師強制循環神經網絡?
- 如何在Python中使用TimeDistributed Layer for Long Short-Term Memory Networks
- 如何準備Keras中截斷反向傳播的序列預測
- 如何在使用LSTM進行訓練和預測時使用不同的批量大小
- Machine Learning Mastery 機器學習算法教程
- 機器學習算法之旅
- 用于機器學習的裝袋和隨機森林集合算法
- 從頭開始實施機器學習算法的好處
- 更好的樸素貝葉斯:從樸素貝葉斯算法中獲取最多的12個技巧
- 機器學習的提升和AdaBoost
- 選擇機器學習算法:Microsoft Azure的經驗教訓
- 機器學習的分類和回歸樹
- 什么是機器學習中的混淆矩陣
- 如何使用Python從頭開始創建算法測試工具
- 通過創建機器學習算法的目標列表來控制
- 從頭開始停止編碼機器學習算法
- 在實現機器學習算法時,不要從開源代碼開始
- 不要使用隨機猜測作為基線分類器
- 淺談機器學習中的概念漂移
- 溫和介紹機器學習中的偏差 - 方差權衡
- 機器學習的梯度下降
- 機器學習算法如何工作(他們學習輸入到輸出的映射)
- 如何建立機器學習算法的直覺
- 如何實現機器學習算法
- 如何研究機器學習算法行為
- 如何學習機器學習算法
- 如何研究機器學習算法
- 如何研究機器學習算法
- 如何在Python中從頭開始實現反向傳播算法
- 如何用Python從頭開始實現Bagging
- 如何用Python從頭開始實現基線機器學習算法
- 如何在Python中從頭開始實現決策樹算法
- 如何用Python從頭開始實現學習向量量化
- 如何利用Python從頭開始隨機梯度下降實現線性回歸
- 如何利用Python從頭開始隨機梯度下降實現Logistic回歸
- 如何用Python從頭開始實現機器學習算法表現指標
- 如何在Python中從頭開始實現感知器算法
- 如何在Python中從零開始實現隨機森林
- 如何在Python中從頭開始實現重采樣方法
- 如何用Python從頭開始實現簡單線性回歸
- 如何用Python從頭開始實現堆棧泛化(Stacking)
- K-Nearest Neighbors for Machine Learning
- 學習機器學習的向量量化
- 機器學習的線性判別分析
- 機器學習的線性回歸
- 使用梯度下降進行機器學習的線性回歸教程
- 如何在Python中從頭開始加載機器學習數據
- 機器學習的Logistic回歸
- 機器學習的Logistic回歸教程
- 機器學習算法迷你課程
- 如何在Python中從頭開始實現樸素貝葉斯
- 樸素貝葉斯機器學習
- 樸素貝葉斯機器學習教程
- 機器學習算法的過擬合和欠擬合
- 參數化和非參數機器學習算法
- 理解任何機器學習算法的6個問題
- 在機器學習中擁抱隨機性
- 如何使用Python從頭開始擴展機器學習數據
- 機器學習的簡單線性回歸教程
- 有監督和無監督的機器學習算法
- 用于機器學習的支持向量機
- 在沒有數學背景的情況下理解機器學習算法的5種技術
- 最好的機器學習算法
- 教程從頭開始在Python中實現k-Nearest Neighbors
- 通過從零開始實現它們來理解機器學習算法(以及繞過壞代碼的策略)
- 使用隨機森林:在121個數據集上測試179個分類器
- 為什么從零開始實現機器學習算法
- Machine Learning Mastery 機器學習入門教程
- 機器學習入門的四個步驟:初學者入門與實踐的自上而下策略
- 你應該培養的 5 個機器學習領域
- 一種選擇機器學習算法的數據驅動方法
- 機器學習中的分析與數值解
- 應用機器學習是一種精英政治
- 機器學習的基本概念
- 如何成為數據科學家
- 初學者如何在機器學習中弄錯
- 機器學習的最佳編程語言
- 構建機器學習組合
- 機器學習中分類與回歸的區別
- 評估自己作為數據科學家并利用結果建立驚人的數據科學團隊
- 探索 Kaggle 大師的方法論和心態:對 Diogo Ferreira 的采訪
- 擴展機器學習工具并展示掌握
- 通過尋找地標開始機器學習
- 溫和地介紹預測建模
- 通過提供結果在機器學習中獲得夢想的工作
- 如何開始機器學習:自學藍圖
- 開始并在機器學習方面取得進展
- 應用機器學習的 Hello World
- 初學者如何使用小型項目開始機器學習并在 Kaggle 上進行競爭
- 我如何開始機器學習? (簡短版)
- 我是如何開始機器學習的
- 如何在機器學習中取得更好的成績
- 如何從在銀行工作到擔任 Target 的高級數據科學家
- 如何學習任何機器學習工具
- 使用小型目標項目深入了解機器學習工具
- 獲得付費申請機器學習
- 映射機器學習工具的景觀
- 機器學習開發環境
- 機器學習金錢
- 程序員的機器學習
- 機器學習很有意思
- 機器學習是 Kaggle 比賽
- 機器學習現在很受歡迎
- 機器學習掌握方法
- 機器學習很重要
- 機器學習 Q& A:概念漂移,更好的結果和學習更快
- 缺乏自學機器學習的路線圖
- 機器學習很重要
- 快速了解任何機器學習工具(即使您是初學者)
- 機器學習工具
- 找到你的機器學習部落
- 機器學習在一年
- 通過競爭一致的大師 Kaggle
- 5 程序員在機器學習中開始犯錯誤
- 哲學畢業生到機器學習從業者(Brian Thomas 采訪)
- 機器學習入門的實用建議
- 實用機器學習問題
- 使用來自 UCI 機器學習庫的數據集練習機器學習
- 使用秘籍的任何機器學習工具快速啟動
- 程序員可以進入機器學習
- 程序員應該進入機器學習
- 項目焦點:Shashank Singh 的人臉識別
- 項目焦點:使用 Mahout 和 Konstantin Slisenko 進行堆棧交換群集
- 機器學習自學指南
- 4 個自學機器學習項目
- álvaroLemos 如何在數據科學團隊中獲得機器學習實習
- 如何思考機器學習
- 現實世界機器學習問題之旅
- 有關機器學習的有用知識
- 如果我沒有學位怎么辦?
- 如果我不是一個優秀的程序員怎么辦?
- 如果我不擅長數學怎么辦?
- 為什么機器學習算法會處理以前從未見過的數據?
- 是什么阻礙了你的機器學習目標?
- 什么是機器學習?
- 機器學習適合哪里?
- 為什么要進入機器學習?
- 研究對您來說很重要的機器學習問題
- 你這樣做是錯的。為什么機器學習不必如此困難
- Machine Learning Mastery Sklearn 教程
- Scikit-Learn 的溫和介紹:Python 機器學習庫
- 使用 Python 管道和 scikit-learn 自動化機器學習工作流程
- 如何以及何時使用帶有 scikit-learn 的校準分類模型
- 如何比較 Python 中的機器學習算法與 scikit-learn
- 用于機器學習開發人員的 Python 崩潰課程
- 用 scikit-learn 在 Python 中集成機器學習算法
- 使用重采樣評估 Python 中機器學習算法的表現
- 使用 Scikit-Learn 在 Python 中進行特征選擇
- Python 中機器學習的特征選擇
- 如何使用 scikit-learn 在 Python 中生成測試數據集
- scikit-learn 中的機器學習算法秘籍
- 如何使用 Python 處理丟失的數據
- 如何開始使用 Python 進行機器學習
- 如何使用 Scikit-Learn 在 Python 中加載數據
- Python 中概率評分方法的簡要介紹
- 如何用 Scikit-Learn 調整算法參數
- 如何在 Mac OS X 上安裝 Python 3 環境以進行機器學習和深度學習
- 使用 scikit-learn 進行機器學習簡介
- 從 shell 到一本帶有 Fernando Perez 單一工具的書的 IPython
- 如何使用 Python 3 為機器學習開發創建 Linux 虛擬機
- 如何在 Python 中加載機器學習數據
- 您在 Python 中的第一個機器學習項目循序漸進
- 如何使用 scikit-learn 進行預測
- 用于評估 Python 中機器學習算法的度量標準
- 使用 Pandas 為 Python 中的機器學習準備數據
- 如何使用 Scikit-Learn 為 Python 機器學習準備數據
- 項目焦點:使用 Artem Yankov 在 Python 中進行事件推薦
- 用于機器學習的 Python 生態系統
- Python 是應用機器學習的成長平臺
- Python 機器學習書籍
- Python 機器學習迷你課程
- 使用 Pandas 快速和骯臟的數據分析
- 使用 Scikit-Learn 重新調整 Python 中的機器學習數據
- 如何以及何時使用 ROC 曲線和精確調用曲線進行 Python 分類
- 使用 scikit-learn 在 Python 中保存和加載機器學習模型
- scikit-learn Cookbook 書評
- 如何使用 Anaconda 為機器學習和深度學習設置 Python 環境
- 使用 scikit-learn 在 Python 中進行 Spot-Check 分類機器學習算法
- 如何在 Python 中開發可重復使用的抽樣檢查算法框架
- 使用 scikit-learn 在 Python 中進行 Spot-Check 回歸機器學習算法
- 使用 Python 中的描述性統計來了解您的機器學習數據
- 使用 OpenCV,Python 和模板匹配來播放“哪里是 Waldo?”
- 使用 Pandas 在 Python 中可視化機器學習數據
- Machine Learning Mastery 統計學教程
- 淺談計算正態匯總統計量
- 非參數統計的溫和介紹
- Python中常態測試的溫和介紹
- 淺談Bootstrap方法
- 淺談機器學習的中心極限定理
- 淺談機器學習中的大數定律
- 機器學習的所有統計數據
- 如何計算Python中機器學習結果的Bootstrap置信區間
- 淺談機器學習的Chi-Squared測試
- 機器學習的置信區間
- 隨機化在機器學習中解決混雜變量的作用
- 機器學習中的受控實驗
- 機器學習統計學速成班
- 統計假設檢驗的關鍵值以及如何在Python中計算它們
- 如何在機器學習中談論數據(統計學和計算機科學術語)
- Python中數據可視化方法的簡要介紹
- Python中效果大小度量的溫和介紹
- 估計隨機機器學習算法的實驗重復次數
- 機器學習評估統計的溫和介紹
- 如何計算Python中的非參數秩相關性
- 如何在Python中計算數據的5位數摘要
- 如何在Python中從頭開始編寫學生t檢驗
- 如何在Python中生成隨機數
- 如何轉換數據以更好地擬合正態分布
- 如何使用相關來理解變量之間的關系
- 如何使用統計信息識別數據中的異常值
- 用于Python機器學習的隨機數生成器簡介
- k-fold交叉驗證的溫和介紹
- 如何計算McNemar的比較兩種機器學習量詞的測試
- Python中非參數統計顯著性測試簡介
- 如何在Python中使用參數統計顯著性測試
- 機器學習的預測間隔
- 應用統計學與機器學習的密切關系
- 如何使用置信區間報告分類器表現
- 統計數據分布的簡要介紹
- 15 Python中的統計假設檢驗(備忘單)
- 統計假設檢驗的溫和介紹
- 10如何在機器學習項目中使用統計方法的示例
- Python中統計功效和功耗分析的簡要介紹
- 統計抽樣和重新抽樣的簡要介紹
- 比較機器學習算法的統計顯著性檢驗
- 機器學習中統計容差區間的溫和介紹
- 機器學習統計書籍
- 評估機器學習模型的統計數據
- 機器學習統計(7天迷你課程)
- 用于機器學習的簡明英語統計
- 如何使用統計顯著性檢驗來解釋機器學習結果
- 什么是統計(為什么它在機器學習中很重要)?
- Machine Learning Mastery 時間序列入門教程
- 如何在 Python 中為時間序列預測創建 ARIMA 模型
- 用 Python 進行時間序列預測的自回歸模型
- 如何回溯機器學習模型的時間序列預測
- Python 中基于時間序列數據的基本特征工程
- R 的時間序列預測熱門書籍
- 10 挑戰機器學習時間序列預測問題
- 如何將時間序列轉換為 Python 中的監督學習問題
- 如何將時間序列數據分解為趨勢和季節性
- 如何用 ARCH 和 GARCH 模擬波動率進行時間序列預測
- 如何將時間序列數據集與 Python 區分開來
- Python 中時間序列預測的指數平滑的溫和介紹
- 用 Python 進行時間序列預測的特征選擇
- 淺談自相關和部分自相關
- 時間序列預測的 Box-Jenkins 方法簡介
- 用 Python 簡要介紹時間序列的時間序列預測
- 如何使用 Python 網格搜索 ARIMA 模型超參數
- 如何在 Python 中加載和探索時間序列數據
- 如何使用 Python 對 ARIMA 模型進行手動預測
- 如何用 Python 進行時間序列預測的預測
- 如何使用 Python 中的 ARIMA 進行樣本外預測
- 如何利用 Python 模擬殘差錯誤來糾正時間序列預測
- 使用 Python 進行數據準備,特征工程和時間序列預測的移動平均平滑
- 多步時間序列預測的 4 種策略
- 如何在 Python 中規范化和標準化時間序列數據
- 如何利用 Python 進行時間序列預測的基線預測
- 如何使用 Python 對時間序列預測數據進行功率變換
- 用于時間序列預測的 Python 環境
- 如何重構時間序列預測問題
- 如何使用 Python 重新采樣和插值您的時間序列數據
- 用 Python 編寫 SARIMA 時間序列預測
- 如何在 Python 中保存 ARIMA 時間序列預測模型
- 使用 Python 進行季節性持久性預測
- 基于 ARIMA 的 Python 歷史規模敏感性預測技巧分析
- 簡單的時間序列預測模型進行測試,這樣你就不會欺騙自己
- 標準多變量,多步驟和多站點時間序列預測問題
- 如何使用 Python 檢查時間序列數據是否是固定的
- 使用 Python 進行時間序列數據可視化
- 7 個機器學習的時間序列數據集
- 時間序列預測案例研究與 Python:波士頓每月武裝搶劫案
- Python 的時間序列預測案例研究:巴爾的摩的年度用水量
- 使用 Python 進行時間序列預測研究:法國香檳的月銷售額
- 使用 Python 的置信區間理解時間序列預測不確定性
- 11 Python 中的經典時間序列預測方法(備忘單)
- 使用 Python 進行時間序列預測表現測量
- 使用 Python 7 天迷你課程進行時間序列預測
- 時間序列預測作為監督學習
- 什么是時間序列預測?
- 如何使用 Python 識別和刪除時間序列數據的季節性
- 如何在 Python 中使用和刪除時間序列數據中的趨勢信息
- 如何在 Python 中調整 ARIMA 參數
- 如何用 Python 可視化時間序列殘差預測錯誤
- 白噪聲時間序列與 Python
- 如何通過時間序列預測項目
- Machine Learning Mastery XGBoost 教程
- 通過在 Python 中使用 XGBoost 提前停止來避免過度擬合
- 如何在 Python 中調優 XGBoost 的多線程支持
- 如何配置梯度提升算法
- 在 Python 中使用 XGBoost 進行梯度提升的數據準備
- 如何使用 scikit-learn 在 Python 中開發您的第一個 XGBoost 模型
- 如何在 Python 中使用 XGBoost 評估梯度提升模型
- 在 Python 中使用 XGBoost 的特征重要性和特征選擇
- 淺談機器學習的梯度提升算法
- 應用機器學習的 XGBoost 簡介
- 如何在 macOS 上為 Python 安裝 XGBoost
- 如何在 Python 中使用 XGBoost 保存梯度提升模型
- 從梯度提升開始,比較 165 個數據集上的 13 種算法
- 在 Python 中使用 XGBoost 和 scikit-learn 進行隨機梯度提升
- 如何使用 Amazon Web Services 在云中訓練 XGBoost 模型
- 在 Python 中使用 XGBoost 調整梯度提升的學習率
- 如何在 Python 中使用 XGBoost 調整決策樹的數量和大小
- 如何在 Python 中使用 XGBoost 可視化梯度提升決策樹
- 在 Python 中開始使用 XGBoost 的 7 步迷你課程