# 如何使用機器學習清單可靠地獲得準確的預測(即使您是初學者)
> 原文: [https://machinelearningmastery.com/machine-learning-checklist/](https://machinelearningmastery.com/machine-learning-checklist/)
如何在問題出現后使用機器學習獲得準確的結果?
困難在于每個問題都是獨特的,需要不同的數據源,特征,算法,算法配置等等。
解決方案是使用每次都能保證良好結果的清單。
在這篇文章中,您將發現一個清單,您可以使用該清單可靠地獲得有關機器學習問題的良好結果。

機器學習清單
照片由 [Crispy](https://www.flickr.com/photos/37333113@N03/14742904577/) 拍攝,部分版權所有。
## 每個數據問題都不同
在開始之前,您不知道哪種算法最能解決問題。
即使專家數據科學家也無法告訴你。
該問題不限于機器學習算法的選擇。您無法知道哪些數據轉換以及數據中哪些特征如果暴露出來最能將問題的結構呈現給算法。
你可能有一些想法。你也可能有一些喜歡的技巧。但是你怎么知道上次讓你獲得成績的技術會讓你獲得好成績呢?
您怎么知道這些技術可以從一個問題轉移到另一個問題?
啟發式算法是一個很好的起點([隨機森林在大多數問題上做得很好](http://machinelearningmastery.com/use-random-forest-testing-179-classifiers-121-datasets/)),但它們就是這樣。一個起點,而不是結束。
## 在每個問題上都不要從零開始
您不需要從頭開始解決每個問題。
就像您可以使用機器學習工具或庫來利用機器學習的最佳實踐實現一樣,您應該利用最佳實踐來解決問題。
另一種方法是每次遇到新問題時都必須補償。結果是您忘記或跳過關鍵步驟。你花費的時間比你需要的時間長,你得到的結果不太準確,你可能沒有那么有趣。
你怎么知道你已經完成了機器學習問題,除非你已經定義了解決方案并且預先使用它?
## 如何可靠地獲得準確的結果
您可以可靠地獲得有關機器學習問題的準確結果。
首先,這是一個經驗問題。什么算法?什么屬性?你必須考慮可能性并嘗試它們。你必須嘗試找到這些問題的答案。
將每個數據集視為搜索問題。找到一個可以產生良好結果的組合。您花費在搜索上的時間與結果的好壞有關。但是有一個拐點,你可以從大量收益轉向收益遞減。
換句話說,數據準備,數據變換,模型選擇,模型調整,集成等選擇是一個組合問題。有許多組合可行,甚至有許多組合足夠好。
通常你不需要最好的解決方案。事實上,最好的解決方案可能是你不想要的。找到它可能是昂貴的,它可能對數據中的擾動很脆弱,并且很可能是過度擬合的產物。
您需要一個好的解決方案,足以滿足您正在處理的問題的特定需求。通常,足夠好的解決方案是快速,廉價和強大的。這是一個更容易解決的問題。
此外,如果您認為自己需要最佳解決方案,則可以使用足夠好的解決方案作為第一個檢查點。
這個簡單的重構從“_最準確_”到“_足夠準確_”結果就是如何保證在你工作的每個機器學習問題上取得好成績。
## 你需要一個機器學習清單
您可以使用核對表來構建搜索正確元素組合的結構,從而可靠地為任何機器學習問題提供良好的解決方案。
[核對表](https://en.wikipedia.org/wiki/Checklist)是一個保證結果的簡單工具。它們一直被用在經驗領域,在那里知識很難獲得,并且保證結果是非常可取的。
例如在航空中起飛和使用飛行前檢查表。此外,在醫學與外科檢查清單和其他領域,如安全合規性。
有關清單的更多信息,請參閱“[清單宣言:如何正確處理](http://www.amazon.com/dp/0312430000?tag=inspiredalgor-20)”一書。
如果結果很重要,為什么每次都要制作一個流程。遵循一套定義明確的解決方案步驟。

清單是航空日常生活的一部分。
照片由 [Jeffery Wong](https://www.flickr.com/photos/jaydubproductions/3707263569) 保留一些權利。
### 機器學習清單的好處
使用清單來解決機器學習問題的5個好處是:
* **減少工作量**:您不必考慮所有技術來嘗試每個新問題。
* **更好的結果**:通過遵循所有步驟,您可以保證獲得良好的結果,可能比平均結果更好。事實上,它可以確保您獲得任何結果。許多項目失敗的原因有很多。
* **改進的起點**:你可以將它作為一個起點,并在你想到更多的東西時添加它。而你總是這樣做。
* **未來項目效益**:您所有未來的項目都將受益于該過程的改進。
* **可自定義流程**:您可以為您的工具,問題類型和首選項設計最佳清單。
機器學習算法非常強大,但將它們視為商品。如果您感興趣的是準確性,那么您使用的具體問題就會少得多。
事實上,這個過程的每個元素都變成了商品,最喜歡的方法的想法開始逐漸消失。我認為這是解決問題的成熟位置。我認為這可能不適合某些努力,比如學術研究。
學術界對特定算法的投入很大。從業者將算法僅視為結束,預測或預測模型的手段。
## 應用機器學習清單
本節概述了一個清單,您可以使用該清單來解決應用的機器學習問題。
如果您對可以下載并用于下一個問題的清單版本感興趣,請查看本文的底部。
該清單基于我之前對KDD /數據挖掘過程的應用,適用于應用機器學習。
您可以在帖子“[什么是數據挖掘和KDD](http://machinelearningmastery.com/what-is-data-mining-and-kdd/) ”中了解有關KDD過程的更多信息。您可以在“[處理機器學習問題](http://machinelearningmastery.com/process-for-working-through-machine-learning-problems/)的過程”中了解有關我建議的工作流程的更多信息。
每個點都可以是博客文章,甚至是書。這個清單中有很多細節被壓縮。我試圖在推理中加入鏈接,并在適當的地方進一步閱讀。
我錯過了一些重要的事嗎?請在評論中告訴我。
[](https://3qeqpr26caki16dnhd19sv6by6v-wpengine.netdna-ssl.com/wp-content/uploads/2015/08/Machine-Learning-for-Programmers-Select-Tools-e1439699936331.png)
將您首選的機器學習工具映射到您選擇的系統過程,以解決問題。
### 關于此示例清單的注釋
為簡潔起見,此示例受到嚴格限制。事實上,認為它是一個示范或原理證明,而不是所有機器學習問題的真實清單 - 它故意不是。
對于處理表格數據的分類問題,我已經限制了這個清單。
另外,為了保持可消化性,我將抽象水平保持在合理的高水平,并將大多數部分限制為三個點。
有時這還不夠,所以我給出了數據轉換和算法的具體示例,以便在清單的某些部分進行嘗試,稱為插入。
讓我們潛入。
### 1.定義問題
在觸摸任何數據或算法之前,必須對問題有一個很好的理解。這將為您提供解釋結果的工具以及解決方案將采用何種形式的愿景。
您可以在帖子“[如何定義您的機器學習問題](http://machinelearningmastery.com/how-to-define-your-machine-learning-problem/)”中深入了解清單的這一部分。
#### 1.1問題是什么?
本節旨在捕捉問題的明確陳述,以及可能已經設定的任何期望和可能存在的偏差。
* 非正式地和正式地定義問題。
* 列出有關問題的假設(例如關于數據)。
* 列出與您的問題類似的已知問題。
#### 1.2為什么需要解決問題?
本節旨在捕捉解決問題的動機,并強制預先考慮預期結果。
* 描述解決問題的動機。
* 描述解決方案的好處(模型或預測)。
* 描述如何使用該解決方案。
#### 1.3如何手動解決問題?
本節旨在清除任何剩余的領域知識,并幫助您評估是否真的需要機器學習解決方案。
* 描述問題目前是如何解決的(如果有的話)。
* 描述主題專家如何進行手動預測。
* 描述程序員如何手動編寫分類器代碼。
### 2.準備數據
了解您的數據是您應該花費大部分時間的地方。
您對數據的理解越好,您可以做的更好的工作就是將其固有的結構暴露給要學習的算法。
深入研究“[如何為機器學習準備數據](http://machinelearningmastery.com/how-to-prepare-data-for-machine-learning/)”和“[機器學習問題的快速和臟數據分析](http://machinelearningmastery.com/quick-and-dirty-data-analysis-for-your-machine-learning-problem/)”中的核對清單的這一部分。
#### 2.1數據描述
本節旨在強制您考慮所有可用和不可用的數據。
* 描述可用數據的范圍。
* 描述不可用但可取的數據。
* 描述您不需要的可用數據。
#### 2.2數據預處理
本節旨在將原始數據組織到您可以在建模工具中使用的表單中。
* 格式化數據,使其處于可以使用的形式。
* 清理數據,使其統一和一致。
* 對數據進行采樣,以便最好地權衡冗余和問題保真度。
#### 插曲:數據采樣的候選名單
在最后的抽樣檢查中可能需要解開很多東西。
這里有兩個重要問題:
1. **示例實例**:創建一個數據樣本,該樣本既代表各種屬性密度,又足夠小,可以快速構建和評估模型。通常它不是一個樣本,而是許多樣本。例如,一個用于子分鐘模型評估,一個用于亞小時,一個用于子日,依此類推。更多數據可以改變算法的表現。
2. **樣本屬性**:選擇最能將數據中的結構暴露給模型的屬性。不同的模型有不同的要求,真正不同的偏好,因為有時打破“_要求_”給出更好的結果。
以下是您可以用來對數據進行采樣的不同方法的一些想法。不要選擇,依次使用每個,并讓測試工具的結果告訴您使用哪種表示。
* 隨機或分層樣本
* 按類重新平衡實例(更多關于重新平衡方法)
* 刪除異常值(更多關于異常值方法)
* 刪除高度更正的屬性
* 應用降維方法(主要組件或t-SNE)
#### 2.3數據轉換
本節旨在創建數據的多個視圖,以便在以后的步驟中將更多的數據問題結構暴露給建模算法。
* 創建所有屬性的線性和非線性轉換
* 將復雜屬性分解為其組成部分。
* 將非規范化屬性聚合為更高階的數量。
#### 插曲:數據轉換的候選名單
您可以使用的數據轉換數量有限。您還可以使用舊的收藏夾作為起點來幫助弄清楚是否值得探索特定的途徑。
下面列出了您可以使用的一些單變量(單屬性)數據轉換。
* 廣場和立方體
* 平方根
* 標準化(例如0均值和單位方差)
* 標準化(例如重新縮放為0-1)
* 描述(例如將真實轉換為分類)
你應該使用哪些?所有這些反過來,再次讓您的測試工具的結果告知您問題的最佳轉換。
#### 2.4數據摘要
本節旨在清除數據中的任何明顯關系。
* 創建每個屬性的單變量圖。
* 使用每個其他屬性創建每個屬性的雙變量圖。
* 使用類變量創建每個屬性的雙變量圖
### 3.抽查算法
現在是時候開始構建和評估模型了。
要深入了解清單的這一部分,請參閱帖子“[如何評估機器學習算法](http://machinelearningmastery.com/how-to-evaluate-machine-learning-algorithms/)”和“[為什么你應該在機器學習問題](http://machinelearningmastery.com/why-you-should-be-spot-checking-algorithms-on-your-machine-learning-problems/)上進行抽樣檢查算法”。
#### 3.1創建測試工具
本節旨在幫助您定義用于模型評估的可靠方法,該方法可以可靠地用于比較結果。
* 創建保留驗證數據集以供日后使用。
* 評估并選擇適當的測試選項。
* 選擇用于評估模型的一個(或一小組)表現度量。
#### 3.2評估候選算法
本節旨在快速了解問題的可學習性,以及哪些算法和數據視圖可能有助于下一步的進一步調查。
* 選擇要評估的各種算法(10-20)。
* 使用通用或標準算法參數配置。
* 在每個準備好的數據視圖上評估每個算法。
#### 插曲:短名單算法嘗試分類問題
坦率地說,列表與點檢查策略無關,也不與您喜歡的算法一致。
然而,如果你正在處理一個分類問題,那么可以使用很好的混合算法來對問題進行建模。例如:
* 基于實例的k-最近鄰和學習向量量化
* 更簡單的方法,如樸素貝葉斯,Logistic回歸和線性判別分析
* 決策樹如CART和C4.5 / C5.0
* 復雜的非線性方法,如反向傳播和支持向量機
* 總是投入隨機森林和梯度提升機器
要獲得有關算法的想法,請參閱帖子“[機器學習算法之旅](http://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/)”
### 4.改善結果
此時,您將擁有一個較小的模型池,這些模型已知對問題有效。現在是時候改善結果了。
您可以在帖子“[如何改善機器學習結果](http://machinelearningmastery.com/how-to-improve-machine-learning-results/)”中深入了解清單的這一部分。
#### 4.1算法調整
本節旨在從表現良好的模型中獲得最大收益。
* 使用歷史上有效的模型參數。
* 搜索模型參數的空間。
* 優化表現良好的模型參數。
#### 4.2集合方法
本節旨在結合表現良好的模型的結果,并進一步提高準確性。
* 在表現良好的模型上使用Bagging。
* 在表現良好的模型上使用Boosting。
* 混合表現良好的模型的結果。
#### 4.3模型選擇
本節旨在確保充分考慮模型選擇過程。
* 選擇表現良好的模型或模型配置的不同子集(5-10)。
* 在保持驗證數據集上評估表現良好的模型。
* 選擇一個小型池(1-3)表現良好的模型。
### 5.完成項目
我們現在有了結果,回顧問題定義并提醒自己如何充分利用它們。
您可以在“[如何使用機器學習結果](http://machinelearningmastery.com/how-to-use-machine-learning-results/)”的帖子中深入了解清單的這一部分。
#### 5.1目前的結果
本節旨在確保您捕獲您所做和所學的內容,以便其他人(以及您未來的自己)可以充分利用它
* 在簡短的報告中寫下項目(1-5頁)。
* 將記錄轉換為幻燈片以與其他人分享調查結果。
* 與感興趣的各方分享代碼和結果。
#### 5.2實施結果
本節旨在確保您實現預先制定的解決方案承諾。
* 使發現的過程從原始數據調整到結果到操作設置。
* 交付并利用預測。
* 提供并利用預測模型。
## 下載您的機器學習清單
每次開始機器學習問題時都不要重新發明輪子。
使用經過實戰檢驗的機器學習清單,快速可靠地獲得準確的結果。
無論您是初學者還是專家,都可以充分利用機器學習。還可以獲得獨家電子郵件提示和技巧。
## 從此清單中獲取最多的提示
我認為這個清單,如果遵循,是一個非常強大的工具。
在本節中,我將向您提供一些其他提示,您可以使用這些提示來充分利用您自己問題的清單。
1. **簡化流程**。第一次嘗試時不要做任何事情。選擇兩種算法進行抽樣檢查,一種數據轉換,一種改進結果的方法,等等。完成清單的一個周期,然后開始添加復雜性。
2. **使用版本控制**。您將創建許多模型和大量腳本(如果您使用的是R或Python)。確保使用版本控制(如 [GitHub](https://github.com/) )不會失去良好的結果。
3. **程序化**。沒有結果,沒有變換,沒有可視化是特殊的。一切都應該在程序上創建。如果你正在使用Weka,這可能是你寫下的一個過程,如果你使用的是R或Python,它可能是Makefile。你會發現你的東西中的錯誤,你可能希望能夠在一滴一滴的情況下重新生成你所有的結果。如果它從頭開始都是程序化的,那就像鍵入“ _make_ ”一樣簡單。
4. **記錄所有結果**。我認為每個算法都運行以保存文件中的預測是一種很好的做法。還要將每個數據轉換和樣本保存在單獨的文件中。如果數據作為項目的一部分位于目錄中的文件中,則始終可以對數據運行新的分析。如果結果需要數小時,數天或數周才能實現,那么這一點非常重要。這包括交叉驗證預測,這些預測可用于更復雜的混合策略。
5. **不要跳過步驟**。你可以縮短一步,但不要跳過任何步驟,即使你認為你知道這一切。清單的想法是保證結果。醫生非常聰明,非常合格,但仍需要提醒他們洗手。有時您可以簡單地忘記過程中的關鍵步驟,這絕對是關鍵(比如定義您的問題并意識到您甚至不需要機器學習)。
## 我很懷疑,這真的有用嗎?
這只是一張清單,而不是銀彈。
你仍然需要投入工作。您仍然需要了解算法和數據操作方法以從中獲得最大收益。您仍然需要了解您的工具以及如何充分利用它們。
#### 親自試試吧。
向自己證明可以通過端到端的方式解決問題。一小時內完成。
1. [選擇一個數據集](http://machinelearningmastery.com/practice-machine-learning-with-small-in-memory-datasets-from-the-uci-machine-learning-repository/)。
2. 使用 [Weka](http://machinelearningmastery.com/how-to-run-your-first-classifier-in-weka/) (避免任何編程)。
3. 使用該過程。
一旦獲得第一個結果,您將看到它是多么容易以及為什么在問題定義,數據準備和在流程后端提供解決方案時花費大量時間這么重要。
#### 這種方法不會給你帶來最好的結果。
該清單可以在問題中可靠,一致地提供良好的結果。
你不會通過這個核對清單贏得 [Kaggle](https://www.kaggle.com/) 比賽,你會得到一個你可以提交的結果,并且可能超過排行榜的50%(通常要高得多)。
您可以使用它來獲得很好的結果,但這是您想要投入多少時間的問題。
#### 清單用于表格數據的分類問題。
我選擇演示這個清單,其中包含表格數據的分類問題。
這并不意味著它僅限于分類問題。您可以輕松地將其適應其他問題類型(如回歸)和其他數據類型(如圖像和文本)。
我過去曾使用過這個清單的變體。
#### 清單不包括技術“ _XYZ_ ”。
清單的美妙之處在于簡單的想法。
如果您不喜歡我已經布置的步驟,請用您自己的步驟替換它們。添加您想要使用的所有技術。建立自己的清單!
如果你這樣做,我很樂意看到一份副本。
#### 這種方法有很多冗余。
我認為通過機器學習問題來處理開發和探索之間的平衡。
您希望利用有關機器學習,數據和域名的所有知識。將這些元素添加到您的流程中以解決給定問題。
但不要排除探索。你需要嘗試你偏見所暗示的不是最好的東西。因為有時候,你的偏見往往不好。這是數據和機器學習的本質。
#### 為什么不只是對管道進行編碼?
為什么不!也許你應該如果你是一個系統人。
我有很多次使用許多不同的工具鏈和平臺。在編碼系統中很難找到合適的靈活性。似乎總有一種方法或工具不適合整齊。
我懷疑許多機器學習即服務(MLaaS)創建一個類似于上述清單的管道,以確保良好的結果。
#### 我不知道為什么會得到好結果。
這可能發生在你是初學者的時候。
您可以而且應該更深入地了解數據準備和建模算法的最終組合。您應該將所有程序都提供給您的結果,以便其他任何人都可以復制它(如果是工作項目,則公開或在您的組織內)。
如果交付方式具有可重復性且評估嚴格,那么良好的結果可以獨立存在。如果執行得好,上面的清單會提供這些功能。
## 行動步驟
使用清單完成項目并建立一些信心。
1. [選擇一個問題](http://machinelearningmastery.com/practice-machine-learning-with-small-in-memory-datasets-from-the-uci-machine-learning-repository/),你可以在1到2小時內完成。
2. 使用清單并獲得結果。
3. 分享您的第一個項目(在評論中)。
您想要上述電子表格的PDF和電子表格版本嗎?
[現在下載](https://machinelearningmastery.leadpages.co/leadbox/146701e73f72a2%3A164f8be4f346dc/5676830073815040/) 并獲得獨家電子郵件提示和技巧。
- Machine Learning Mastery 應用機器學習教程
- 5競爭機器學習的好處
- 過度擬合的簡單直覺,或者為什么測試訓練數據是一個壞主意
- 特征選擇簡介
- 應用機器學習作為一個搜索問題的溫和介紹
- 為什么應用機器學習很難
- 為什么我的結果不如我想的那么好?你可能過度擬合了
- 用ROC曲線評估和比較分類器表現
- BigML評論:發現本機學習即服務平臺的聰明功能
- BigML教程:開發您的第一個決策樹并進行預測
- 構建生產機器學習基礎設施
- 分類準確性不夠:可以使用更多表現測量
- 一種預測模型的巧妙應用
- 機器學習項目中常見的陷阱
- 數據清理:將凌亂的數據轉換為整潔的數據
- 機器學習中的數據泄漏
- 數據,學習和建模
- 數據管理至關重要以及為什么需要認真對待它
- 將預測模型部署到生產中
- 參數和超參數之間有什么區別?
- 測試和驗證數據集之間有什么區別?
- 發現特征工程,如何設計特征以及如何獲得它
- 如何開始使用Kaggle
- 超越預測
- 如何在評估機器學習算法時選擇正確的測試選項
- 如何定義機器學習問題
- 如何評估機器學習算法
- 如何獲得基線結果及其重要性
- 如何充分利用機器學習數據
- 如何識別數據中的異常值
- 如何提高機器學習效果
- 如何在競爭機器學習中踢屁股
- 如何知道您的機器學習模型是否具有良好的表現
- 如何布局和管理您的機器學習項目
- 如何為機器學習準備數據
- 如何減少最終機器學習模型中的方差
- 如何使用機器學習結果
- 如何解決像數據科學家這樣的問題
- 通過數據預處理提高模型精度
- 處理機器學習的大數據文件的7種方法
- 建立機器學習系統的經驗教訓
- 如何使用機器學習清單可靠地獲得準確的預測(即使您是初學者)
- 機器學習模型運行期間要做什么
- 機器學習表現改進備忘單
- 來自世界級從業者的機器學習技巧:Phil Brierley
- 模型預測精度與機器學習中的解釋
- 競爭機器學習的模型選擇技巧
- 機器學習需要多少訓練數據?
- 如何系統地規劃和運行機器學習實驗
- 應用機器學習過程
- 默認情況下可重現的機器學習結果
- 10個實踐應用機器學習的標準數據集
- 簡單的三步法到最佳機器學習算法
- 打擊機器學習數據集中不平衡類的8種策略
- 模型表現不匹配問題(以及如何處理)
- 黑箱機器學習的誘惑陷阱
- 如何培養最終的機器學習模型
- 使用探索性數據分析了解您的問題并獲得更好的結果
- 什么是數據挖掘和KDD
- 為什么One-Hot在機器學習中編碼數據?
- 為什么你應該在你的機器學習問題上進行抽樣檢查算法
- 所以,你正在研究機器學習問題......
- Machine Learning Mastery Keras 深度學習教程
- Keras 中神經網絡模型的 5 步生命周期
- 在 Python 迷你課程中應用深度學習
- Keras 深度學習庫的二元分類教程
- 如何用 Keras 構建多層感知器神經網絡模型
- 如何在 Keras 中檢查深度學習模型
- 10 個用于 Amazon Web Services 深度學習的命令行秘籍
- 機器學習卷積神經網絡的速成課程
- 如何在 Python 中使用 Keras 進行深度學習的度量
- 深度學習書籍
- 深度學習課程
- 你所知道的深度學習是一種謊言
- 如何設置 Amazon AWS EC2 GPU 以訓練 Keras 深度學習模型(分步)
- 神經網絡中批量和迭代之間的區別是什么?
- 在 Keras 展示深度學習模型訓練歷史
- 基于 Keras 的深度學習模型中的dropout正則化
- 評估 Keras 中深度學習模型的表現
- 如何評價深度學習模型的技巧
- 小批量梯度下降的簡要介紹以及如何配置批量大小
- 在 Keras 中獲得深度學習幫助的 9 種方法
- 如何使用 Keras 在 Python 中網格搜索深度學習模型的超參數
- 用 Keras 在 Python 中使用卷積神經網絡進行手寫數字識別
- 如何用 Keras 進行預測
- 用 Keras 進行深度學習的圖像增強
- 8 個深度學習的鼓舞人心的應用
- Python 深度學習庫 Keras 簡介
- Python 深度學習庫 TensorFlow 簡介
- Python 深度學習庫 Theano 簡介
- 如何使用 Keras 函數式 API 進行深度學習
- Keras 深度學習庫的多類分類教程
- 多層感知器神經網絡速成課程
- 基于卷積神經網絡的 Keras 深度學習庫中的目標識別
- 流行的深度學習庫
- 用深度學習預測電影評論的情感
- Python 中的 Keras 深度學習庫的回歸教程
- 如何使用 Keras 獲得可重現的結果
- 如何在 Linux 服務器上運行深度學習實驗
- 保存并加載您的 Keras 深度學習模型
- 用 Keras 逐步開發 Python 中的第一個神經網絡
- 用 Keras 理解 Python 中的有狀態 LSTM 循環神經網絡
- 在 Python 中使用 Keras 深度學習模型和 Scikit-Learn
- 如何使用預訓練的 VGG 模型對照片中的物體進行分類
- 在 Python 和 Keras 中對深度學習模型使用學習率調度
- 如何在 Keras 中可視化深度學習神經網絡模型
- 什么是深度學習?
- 何時使用 MLP,CNN 和 RNN 神經網絡
- 為什么用隨機權重初始化神經網絡?
- Machine Learning Mastery 深度學習 NLP 教程
- 深度學習在自然語言處理中的 7 個應用
- 如何實現自然語言處理的波束搜索解碼器
- 深度學習文檔分類的最佳實踐
- 關于自然語言處理的熱門書籍
- 在 Python 中計算文本 BLEU 分數的溫和介紹
- 使用編碼器 - 解碼器模型的用于字幕生成的注入和合并架構
- 如何用 Python 清理機器學習的文本
- 如何配置神經機器翻譯的編碼器 - 解碼器模型
- 如何開始深度學習自然語言處理(7 天迷你課程)
- 自然語言處理的數據集
- 如何開發一種深度學習的詞袋模型來預測電影評論情感
- 深度學習字幕生成模型的溫和介紹
- 如何在 Keras 中定義神經機器翻譯的編碼器 - 解碼器序列 - 序列模型
- 如何利用小實驗在 Keras 中開發字幕生成模型
- 如何從頭開發深度學習圖片標題生成器
- 如何在 Keras 中開發基于字符的神經語言模型
- 如何開發用于情感分析的 N-gram 多通道卷積神經網絡
- 如何從零開始開發神經機器翻譯系統
- 如何在 Python 中用 Keras 開發基于單詞的神經語言模型
- 如何開發一種預測電影評論情感的詞嵌入模型
- 如何使用 Gensim 在 Python 中開發詞嵌入
- 用于文本摘要的編碼器 - 解碼器深度學習模型
- Keras 中文本摘要的編碼器 - 解碼器模型
- 用于神經機器翻譯的編碼器 - 解碼器循環神經網絡模型
- 淺談詞袋模型
- 文本摘要的溫和介紹
- 編碼器 - 解碼器循環神經網絡中的注意力如何工作
- 如何利用深度學習自動生成照片的文本描述
- 如何開發一個單詞級神經語言模型并用它來生成文本
- 淺談神經機器翻譯
- 什么是自然語言處理?
- 牛津自然語言處理深度學習課程
- 如何為機器翻譯準備法語到英語的數據集
- 如何為情感分析準備電影評論數據
- 如何為文本摘要準備新聞文章
- 如何準備照片標題數據集以訓練深度學習模型
- 如何使用 Keras 為深度學習準備文本數據
- 如何使用 scikit-learn 為機器學習準備文本數據
- 自然語言處理神經網絡模型入門
- 對自然語言處理的深度學習的承諾
- 在 Python 中用 Keras 進行 LSTM 循環神經網絡的序列分類
- 斯坦福自然語言處理深度學習課程評價
- 統計語言建模和神經語言模型的簡要介紹
- 使用 Keras 在 Python 中進行 LSTM 循環神經網絡的文本生成
- 淺談機器學習中的轉換
- 如何使用 Keras 將詞嵌入層用于深度學習
- 什么是用于文本的詞嵌入
- Machine Learning Mastery 深度學習時間序列教程
- 如何開發人類活動識別的一維卷積神經網絡模型
- 人類活動識別的深度學習模型
- 如何評估人類活動識別的機器學習算法
- 時間序列預測的多層感知器網絡探索性配置
- 比較經典和機器學習方法進行時間序列預測的結果
- 如何通過深度學習快速獲得時間序列預測的結果
- 如何利用 Python 處理序列預測問題中的缺失時間步長
- 如何建立預測大氣污染日的概率預測模型
- 如何開發一種熟練的機器學習時間序列預測模型
- 如何構建家庭用電自回歸預測模型
- 如何開發多步空氣污染時間序列預測的自回歸預測模型
- 如何制定多站點多元空氣污染時間序列預測的基線預測
- 如何開發時間序列預測的卷積神經網絡模型
- 如何開發卷積神經網絡用于多步時間序列預測
- 如何開發單變量時間序列預測的深度學習模型
- 如何開發 LSTM 模型用于家庭用電的多步時間序列預測
- 如何開發 LSTM 模型進行時間序列預測
- 如何開發多元多步空氣污染時間序列預測的機器學習模型
- 如何開發多層感知器模型進行時間序列預測
- 如何開發人類活動識別時間序列分類的 RNN 模型
- 如何開始深度學習的時間序列預測(7 天迷你課程)
- 如何網格搜索深度學習模型進行時間序列預測
- 如何對單變量時間序列預測的網格搜索樸素方法
- 如何在 Python 中搜索 SARIMA 模型超參數用于時間序列預測
- 如何在 Python 中進行時間序列預測的網格搜索三次指數平滑
- 一個標準的人類活動識別問題的溫和介紹
- 如何加載和探索家庭用電數據
- 如何加載,可視化和探索復雜的多變量多步時間序列預測數據集
- 如何從智能手機數據模擬人類活動
- 如何根據環境因素預測房間占用率
- 如何使用腦波預測人眼是開放還是閉合
- 如何在 Python 中擴展長短期內存網絡的數據
- 如何使用 TimeseriesGenerator 進行 Keras 中的時間序列預測
- 基于機器學習算法的室內運動時間序列分類
- 用于時間序列預測的狀態 LSTM 在線學習的不穩定性
- 用于罕見事件時間序列預測的 LSTM 模型體系結構
- 用于時間序列預測的 4 種通用機器學習數據變換
- Python 中長短期記憶網絡的多步時間序列預測
- 家庭用電機器學習的多步時間序列預測
- Keras 中 LSTM 的多變量時間序列預測
- 如何開發和評估樸素的家庭用電量預測方法
- 如何為長短期記憶網絡準備單變量時間序列數據
- 循環神經網絡在時間序列預測中的應用
- 如何在 Python 中使用差異變換刪除趨勢和季節性
- 如何在 LSTM 中種子狀態用于 Python 中的時間序列預測
- 使用 Python 進行時間序列預測的有狀態和無狀態 LSTM
- 長短時記憶網絡在時間序列預測中的適用性
- 時間序列預測問題的分類
- Python 中長短期記憶網絡的時間序列預測
- 基于 Keras 的 Python 中 LSTM 循環神經網絡的時間序列預測
- Keras 中深度學習的時間序列預測
- 如何用 Keras 調整 LSTM 超參數進行時間序列預測
- 如何在時間序列預測訓練期間更新 LSTM 網絡
- 如何使用 LSTM 網絡的 Dropout 進行時間序列預測
- 如何使用 LSTM 網絡中的特征進行時間序列預測
- 如何在 LSTM 網絡中使用時間序列進行時間序列預測
- 如何利用 LSTM 網絡進行權重正則化進行時間序列預測
- Machine Learning Mastery 線性代數教程
- 機器學習數學符號的基礎知識
- 用 NumPy 陣列輕松介紹廣播
- 如何從 Python 中的 Scratch 計算主成分分析(PCA)
- 用于編碼器審查的計算線性代數
- 10 機器學習中的線性代數示例
- 線性代數的溫和介紹
- 用 NumPy 輕松介紹 Python 中的 N 維數組
- 機器學習向量的溫和介紹
- 如何在 Python 中為機器學習索引,切片和重塑 NumPy 數組
- 機器學習的矩陣和矩陣算法簡介
- 溫和地介紹機器學習的特征分解,特征值和特征向量
- NumPy 對預期價值,方差和協方差的簡要介紹
- 機器學習矩陣分解的溫和介紹
- 用 NumPy 輕松介紹機器學習的張量
- 用于機器學習的線性代數中的矩陣類型簡介
- 用于機器學習的線性代數備忘單
- 線性代數的深度學習
- 用于機器學習的線性代數(7 天迷你課程)
- 機器學習的線性代數
- 機器學習矩陣運算的溫和介紹
- 線性代數評論沒有廢話指南
- 學習機器學習線性代數的主要資源
- 淺談機器學習的奇異值分解
- 如何用線性代數求解線性回歸
- 用于機器學習的稀疏矩陣的溫和介紹
- 機器學習中向量規范的溫和介紹
- 學習線性代數用于機器學習的 5 個理由
- Machine Learning Mastery LSTM 教程
- Keras中長短期記憶模型的5步生命周期
- 長短時記憶循環神經網絡的注意事項
- CNN長短期記憶網絡
- 逆向神經網絡中的深度學習速成課程
- 可變長度輸入序列的數據準備
- 如何用Keras開發用于Python序列分類的雙向LSTM
- 如何開發Keras序列到序列預測的編碼器 - 解碼器模型
- 如何診斷LSTM模型的過度擬合和欠擬合
- 如何開發一種編碼器 - 解碼器模型,注重Keras中的序列到序列預測
- 編碼器 - 解碼器長短期存儲器網絡
- 神經網絡中爆炸梯度的溫和介紹
- 對時間反向傳播的溫和介紹
- 生成長短期記憶網絡的溫和介紹
- 專家對長短期記憶網絡的簡要介紹
- 在序列預測問題上充分利用LSTM
- 編輯器 - 解碼器循環神經網絡全局注意的溫和介紹
- 如何利用長短時記憶循環神經網絡處理很長的序列
- 如何在Python中對一個熱編碼序列數據
- 如何使用編碼器 - 解碼器LSTM來回顯隨機整數序列
- 具有注意力的編碼器 - 解碼器RNN體系結構的實現模式
- 學習使用編碼器解碼器LSTM循環神經網絡添加數字
- 如何學習長短時記憶循環神經網絡回聲隨機整數
- 具有Keras的長短期記憶循環神經網絡的迷你課程
- LSTM自動編碼器的溫和介紹
- 如何用Keras中的長短期記憶模型進行預測
- 用Python中的長短期內存網絡演示內存
- 基于循環神經網絡的序列預測模型的簡要介紹
- 深度學習的循環神經網絡算法之旅
- 如何重塑Keras中長短期存儲網絡的輸入數據
- 了解Keras中LSTM的返回序列和返回狀態之間的差異
- RNN展開的溫和介紹
- 5學習LSTM循環神經網絡的簡單序列預測問題的例子
- 使用序列進行預測
- 堆疊長短期內存網絡
- 什么是教師強制循環神經網絡?
- 如何在Python中使用TimeDistributed Layer for Long Short-Term Memory Networks
- 如何準備Keras中截斷反向傳播的序列預測
- 如何在使用LSTM進行訓練和預測時使用不同的批量大小
- Machine Learning Mastery 機器學習算法教程
- 機器學習算法之旅
- 用于機器學習的裝袋和隨機森林集合算法
- 從頭開始實施機器學習算法的好處
- 更好的樸素貝葉斯:從樸素貝葉斯算法中獲取最多的12個技巧
- 機器學習的提升和AdaBoost
- 選擇機器學習算法:Microsoft Azure的經驗教訓
- 機器學習的分類和回歸樹
- 什么是機器學習中的混淆矩陣
- 如何使用Python從頭開始創建算法測試工具
- 通過創建機器學習算法的目標列表來控制
- 從頭開始停止編碼機器學習算法
- 在實現機器學習算法時,不要從開源代碼開始
- 不要使用隨機猜測作為基線分類器
- 淺談機器學習中的概念漂移
- 溫和介紹機器學習中的偏差 - 方差權衡
- 機器學習的梯度下降
- 機器學習算法如何工作(他們學習輸入到輸出的映射)
- 如何建立機器學習算法的直覺
- 如何實現機器學習算法
- 如何研究機器學習算法行為
- 如何學習機器學習算法
- 如何研究機器學習算法
- 如何研究機器學習算法
- 如何在Python中從頭開始實現反向傳播算法
- 如何用Python從頭開始實現Bagging
- 如何用Python從頭開始實現基線機器學習算法
- 如何在Python中從頭開始實現決策樹算法
- 如何用Python從頭開始實現學習向量量化
- 如何利用Python從頭開始隨機梯度下降實現線性回歸
- 如何利用Python從頭開始隨機梯度下降實現Logistic回歸
- 如何用Python從頭開始實現機器學習算法表現指標
- 如何在Python中從頭開始實現感知器算法
- 如何在Python中從零開始實現隨機森林
- 如何在Python中從頭開始實現重采樣方法
- 如何用Python從頭開始實現簡單線性回歸
- 如何用Python從頭開始實現堆棧泛化(Stacking)
- K-Nearest Neighbors for Machine Learning
- 學習機器學習的向量量化
- 機器學習的線性判別分析
- 機器學習的線性回歸
- 使用梯度下降進行機器學習的線性回歸教程
- 如何在Python中從頭開始加載機器學習數據
- 機器學習的Logistic回歸
- 機器學習的Logistic回歸教程
- 機器學習算法迷你課程
- 如何在Python中從頭開始實現樸素貝葉斯
- 樸素貝葉斯機器學習
- 樸素貝葉斯機器學習教程
- 機器學習算法的過擬合和欠擬合
- 參數化和非參數機器學習算法
- 理解任何機器學習算法的6個問題
- 在機器學習中擁抱隨機性
- 如何使用Python從頭開始擴展機器學習數據
- 機器學習的簡單線性回歸教程
- 有監督和無監督的機器學習算法
- 用于機器學習的支持向量機
- 在沒有數學背景的情況下理解機器學習算法的5種技術
- 最好的機器學習算法
- 教程從頭開始在Python中實現k-Nearest Neighbors
- 通過從零開始實現它們來理解機器學習算法(以及繞過壞代碼的策略)
- 使用隨機森林:在121個數據集上測試179個分類器
- 為什么從零開始實現機器學習算法
- Machine Learning Mastery 機器學習入門教程
- 機器學習入門的四個步驟:初學者入門與實踐的自上而下策略
- 你應該培養的 5 個機器學習領域
- 一種選擇機器學習算法的數據驅動方法
- 機器學習中的分析與數值解
- 應用機器學習是一種精英政治
- 機器學習的基本概念
- 如何成為數據科學家
- 初學者如何在機器學習中弄錯
- 機器學習的最佳編程語言
- 構建機器學習組合
- 機器學習中分類與回歸的區別
- 評估自己作為數據科學家并利用結果建立驚人的數據科學團隊
- 探索 Kaggle 大師的方法論和心態:對 Diogo Ferreira 的采訪
- 擴展機器學習工具并展示掌握
- 通過尋找地標開始機器學習
- 溫和地介紹預測建模
- 通過提供結果在機器學習中獲得夢想的工作
- 如何開始機器學習:自學藍圖
- 開始并在機器學習方面取得進展
- 應用機器學習的 Hello World
- 初學者如何使用小型項目開始機器學習并在 Kaggle 上進行競爭
- 我如何開始機器學習? (簡短版)
- 我是如何開始機器學習的
- 如何在機器學習中取得更好的成績
- 如何從在銀行工作到擔任 Target 的高級數據科學家
- 如何學習任何機器學習工具
- 使用小型目標項目深入了解機器學習工具
- 獲得付費申請機器學習
- 映射機器學習工具的景觀
- 機器學習開發環境
- 機器學習金錢
- 程序員的機器學習
- 機器學習很有意思
- 機器學習是 Kaggle 比賽
- 機器學習現在很受歡迎
- 機器學習掌握方法
- 機器學習很重要
- 機器學習 Q& A:概念漂移,更好的結果和學習更快
- 缺乏自學機器學習的路線圖
- 機器學習很重要
- 快速了解任何機器學習工具(即使您是初學者)
- 機器學習工具
- 找到你的機器學習部落
- 機器學習在一年
- 通過競爭一致的大師 Kaggle
- 5 程序員在機器學習中開始犯錯誤
- 哲學畢業生到機器學習從業者(Brian Thomas 采訪)
- 機器學習入門的實用建議
- 實用機器學習問題
- 使用來自 UCI 機器學習庫的數據集練習機器學習
- 使用秘籍的任何機器學習工具快速啟動
- 程序員可以進入機器學習
- 程序員應該進入機器學習
- 項目焦點:Shashank Singh 的人臉識別
- 項目焦點:使用 Mahout 和 Konstantin Slisenko 進行堆棧交換群集
- 機器學習自學指南
- 4 個自學機器學習項目
- álvaroLemos 如何在數據科學團隊中獲得機器學習實習
- 如何思考機器學習
- 現實世界機器學習問題之旅
- 有關機器學習的有用知識
- 如果我沒有學位怎么辦?
- 如果我不是一個優秀的程序員怎么辦?
- 如果我不擅長數學怎么辦?
- 為什么機器學習算法會處理以前從未見過的數據?
- 是什么阻礙了你的機器學習目標?
- 什么是機器學習?
- 機器學習適合哪里?
- 為什么要進入機器學習?
- 研究對您來說很重要的機器學習問題
- 你這樣做是錯的。為什么機器學習不必如此困難
- Machine Learning Mastery Sklearn 教程
- Scikit-Learn 的溫和介紹:Python 機器學習庫
- 使用 Python 管道和 scikit-learn 自動化機器學習工作流程
- 如何以及何時使用帶有 scikit-learn 的校準分類模型
- 如何比較 Python 中的機器學習算法與 scikit-learn
- 用于機器學習開發人員的 Python 崩潰課程
- 用 scikit-learn 在 Python 中集成機器學習算法
- 使用重采樣評估 Python 中機器學習算法的表現
- 使用 Scikit-Learn 在 Python 中進行特征選擇
- Python 中機器學習的特征選擇
- 如何使用 scikit-learn 在 Python 中生成測試數據集
- scikit-learn 中的機器學習算法秘籍
- 如何使用 Python 處理丟失的數據
- 如何開始使用 Python 進行機器學習
- 如何使用 Scikit-Learn 在 Python 中加載數據
- Python 中概率評分方法的簡要介紹
- 如何用 Scikit-Learn 調整算法參數
- 如何在 Mac OS X 上安裝 Python 3 環境以進行機器學習和深度學習
- 使用 scikit-learn 進行機器學習簡介
- 從 shell 到一本帶有 Fernando Perez 單一工具的書的 IPython
- 如何使用 Python 3 為機器學習開發創建 Linux 虛擬機
- 如何在 Python 中加載機器學習數據
- 您在 Python 中的第一個機器學習項目循序漸進
- 如何使用 scikit-learn 進行預測
- 用于評估 Python 中機器學習算法的度量標準
- 使用 Pandas 為 Python 中的機器學習準備數據
- 如何使用 Scikit-Learn 為 Python 機器學習準備數據
- 項目焦點:使用 Artem Yankov 在 Python 中進行事件推薦
- 用于機器學習的 Python 生態系統
- Python 是應用機器學習的成長平臺
- Python 機器學習書籍
- Python 機器學習迷你課程
- 使用 Pandas 快速和骯臟的數據分析
- 使用 Scikit-Learn 重新調整 Python 中的機器學習數據
- 如何以及何時使用 ROC 曲線和精確調用曲線進行 Python 分類
- 使用 scikit-learn 在 Python 中保存和加載機器學習模型
- scikit-learn Cookbook 書評
- 如何使用 Anaconda 為機器學習和深度學習設置 Python 環境
- 使用 scikit-learn 在 Python 中進行 Spot-Check 分類機器學習算法
- 如何在 Python 中開發可重復使用的抽樣檢查算法框架
- 使用 scikit-learn 在 Python 中進行 Spot-Check 回歸機器學習算法
- 使用 Python 中的描述性統計來了解您的機器學習數據
- 使用 OpenCV,Python 和模板匹配來播放“哪里是 Waldo?”
- 使用 Pandas 在 Python 中可視化機器學習數據
- Machine Learning Mastery 統計學教程
- 淺談計算正態匯總統計量
- 非參數統計的溫和介紹
- Python中常態測試的溫和介紹
- 淺談Bootstrap方法
- 淺談機器學習的中心極限定理
- 淺談機器學習中的大數定律
- 機器學習的所有統計數據
- 如何計算Python中機器學習結果的Bootstrap置信區間
- 淺談機器學習的Chi-Squared測試
- 機器學習的置信區間
- 隨機化在機器學習中解決混雜變量的作用
- 機器學習中的受控實驗
- 機器學習統計學速成班
- 統計假設檢驗的關鍵值以及如何在Python中計算它們
- 如何在機器學習中談論數據(統計學和計算機科學術語)
- Python中數據可視化方法的簡要介紹
- Python中效果大小度量的溫和介紹
- 估計隨機機器學習算法的實驗重復次數
- 機器學習評估統計的溫和介紹
- 如何計算Python中的非參數秩相關性
- 如何在Python中計算數據的5位數摘要
- 如何在Python中從頭開始編寫學生t檢驗
- 如何在Python中生成隨機數
- 如何轉換數據以更好地擬合正態分布
- 如何使用相關來理解變量之間的關系
- 如何使用統計信息識別數據中的異常值
- 用于Python機器學習的隨機數生成器簡介
- k-fold交叉驗證的溫和介紹
- 如何計算McNemar的比較兩種機器學習量詞的測試
- Python中非參數統計顯著性測試簡介
- 如何在Python中使用參數統計顯著性測試
- 機器學習的預測間隔
- 應用統計學與機器學習的密切關系
- 如何使用置信區間報告分類器表現
- 統計數據分布的簡要介紹
- 15 Python中的統計假設檢驗(備忘單)
- 統計假設檢驗的溫和介紹
- 10如何在機器學習項目中使用統計方法的示例
- Python中統計功效和功耗分析的簡要介紹
- 統計抽樣和重新抽樣的簡要介紹
- 比較機器學習算法的統計顯著性檢驗
- 機器學習中統計容差區間的溫和介紹
- 機器學習統計書籍
- 評估機器學習模型的統計數據
- 機器學習統計(7天迷你課程)
- 用于機器學習的簡明英語統計
- 如何使用統計顯著性檢驗來解釋機器學習結果
- 什么是統計(為什么它在機器學習中很重要)?
- Machine Learning Mastery 時間序列入門教程
- 如何在 Python 中為時間序列預測創建 ARIMA 模型
- 用 Python 進行時間序列預測的自回歸模型
- 如何回溯機器學習模型的時間序列預測
- Python 中基于時間序列數據的基本特征工程
- R 的時間序列預測熱門書籍
- 10 挑戰機器學習時間序列預測問題
- 如何將時間序列轉換為 Python 中的監督學習問題
- 如何將時間序列數據分解為趨勢和季節性
- 如何用 ARCH 和 GARCH 模擬波動率進行時間序列預測
- 如何將時間序列數據集與 Python 區分開來
- Python 中時間序列預測的指數平滑的溫和介紹
- 用 Python 進行時間序列預測的特征選擇
- 淺談自相關和部分自相關
- 時間序列預測的 Box-Jenkins 方法簡介
- 用 Python 簡要介紹時間序列的時間序列預測
- 如何使用 Python 網格搜索 ARIMA 模型超參數
- 如何在 Python 中加載和探索時間序列數據
- 如何使用 Python 對 ARIMA 模型進行手動預測
- 如何用 Python 進行時間序列預測的預測
- 如何使用 Python 中的 ARIMA 進行樣本外預測
- 如何利用 Python 模擬殘差錯誤來糾正時間序列預測
- 使用 Python 進行數據準備,特征工程和時間序列預測的移動平均平滑
- 多步時間序列預測的 4 種策略
- 如何在 Python 中規范化和標準化時間序列數據
- 如何利用 Python 進行時間序列預測的基線預測
- 如何使用 Python 對時間序列預測數據進行功率變換
- 用于時間序列預測的 Python 環境
- 如何重構時間序列預測問題
- 如何使用 Python 重新采樣和插值您的時間序列數據
- 用 Python 編寫 SARIMA 時間序列預測
- 如何在 Python 中保存 ARIMA 時間序列預測模型
- 使用 Python 進行季節性持久性預測
- 基于 ARIMA 的 Python 歷史規模敏感性預測技巧分析
- 簡單的時間序列預測模型進行測試,這樣你就不會欺騙自己
- 標準多變量,多步驟和多站點時間序列預測問題
- 如何使用 Python 檢查時間序列數據是否是固定的
- 使用 Python 進行時間序列數據可視化
- 7 個機器學習的時間序列數據集
- 時間序列預測案例研究與 Python:波士頓每月武裝搶劫案
- Python 的時間序列預測案例研究:巴爾的摩的年度用水量
- 使用 Python 進行時間序列預測研究:法國香檳的月銷售額
- 使用 Python 的置信區間理解時間序列預測不確定性
- 11 Python 中的經典時間序列預測方法(備忘單)
- 使用 Python 進行時間序列預測表現測量
- 使用 Python 7 天迷你課程進行時間序列預測
- 時間序列預測作為監督學習
- 什么是時間序列預測?
- 如何使用 Python 識別和刪除時間序列數據的季節性
- 如何在 Python 中使用和刪除時間序列數據中的趨勢信息
- 如何在 Python 中調整 ARIMA 參數
- 如何用 Python 可視化時間序列殘差預測錯誤
- 白噪聲時間序列與 Python
- 如何通過時間序列預測項目
- Machine Learning Mastery XGBoost 教程
- 通過在 Python 中使用 XGBoost 提前停止來避免過度擬合
- 如何在 Python 中調優 XGBoost 的多線程支持
- 如何配置梯度提升算法
- 在 Python 中使用 XGBoost 進行梯度提升的數據準備
- 如何使用 scikit-learn 在 Python 中開發您的第一個 XGBoost 模型
- 如何在 Python 中使用 XGBoost 評估梯度提升模型
- 在 Python 中使用 XGBoost 的特征重要性和特征選擇
- 淺談機器學習的梯度提升算法
- 應用機器學習的 XGBoost 簡介
- 如何在 macOS 上為 Python 安裝 XGBoost
- 如何在 Python 中使用 XGBoost 保存梯度提升模型
- 從梯度提升開始,比較 165 個數據集上的 13 種算法
- 在 Python 中使用 XGBoost 和 scikit-learn 進行隨機梯度提升
- 如何使用 Amazon Web Services 在云中訓練 XGBoost 模型
- 在 Python 中使用 XGBoost 調整梯度提升的學習率
- 如何在 Python 中使用 XGBoost 調整決策樹的數量和大小
- 如何在 Python 中使用 XGBoost 可視化梯度提升決策樹
- 在 Python 中開始使用 XGBoost 的 7 步迷你課程