<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                合規國際互聯網加速 OSASE為企業客戶提供高速穩定SD-WAN國際加速解決方案。 廣告
                # 如何獲得基線結果及其重要性 > 原文: [https://machinelearningmastery.com/how-to-get-baseline-results-and-why-they-matter/](https://machinelearningmastery.com/how-to-get-baseline-results-and-why-they-matter/) 在我的課程和指南中,我在深入研究現場檢查算法之前教授基線結果的準備。 我的一名學生最近問: > 如果沒有針對問題計算基線,是否會使其他算法的結果有問題? 他繼續問: > 如果其他算法沒有提供比基線更好的準確度,我們應該從中得到什么教訓?它是否表明數據集沒有預測能力? 這些都是很好的問題,它們解釋了為什么我們首先創建基線以及它提供的過濾能力。 在本文中,您將了解為什么我們創建基線預測結果,如何創建基線以及特定問題類型,以及如何使用它來通知您可用的數據和您正在使用的算法。 [![Baseline Machine Learning Results](https://img.kancloud.cn/66/4c/664ccc99701ffe599be380ce613fb58e_480x640.jpg)](https://3qeqpr26caki16dnhd19sv6by6v-wpengine.netdna-ssl.com/wp-content/uploads/2014/11/Baseline-Machine-Learning-Results.jpg) 基線機器學習結果 照片由[特雷西驚人](http://www.flickr.com/photos/tracy_the_astonishing/7226371136),保留一些權利 ## 查找可以建模的數據 當您練習機器學習時,每個問題都是獨一無二的。您很可能以前沒有看到它,您無法知道要使用哪些算法,哪些數據屬性將是有用的,甚至是否可以有效地建模問題。 我個人認為這是最激動人心的時刻。 如果您處于這種情況,您很可能自己從不同的來源收集數據并選擇您認為可能有價值的屬性。 [將需要特征選擇](http://machinelearningmastery.com/an-introduction-to-feature-selection/ "An Introduction to Feature Selection")和[特征工程](http://machinelearningmastery.com/discover-feature-engineering-how-to-engineer-features-and-how-to-get-good-at-it/ "Discover Feature Engineering, How to Engineer Features and How to Get Good at It")。 在此過程中,您需要了解您迭代嘗試定義和收集數據的問題為進行預測提供了有用的基礎。 ## 一個有用的比較點 您需要針對問題的[抽樣檢查算法](http://machinelearningmastery.com/why-you-should-be-spot-checking-algorithms-on-your-machine-learning-problems/ "Why you should be Spot-Checking Algorithms on your Machine Learning Problems"),看看您是否有一個有用的基礎來建模您的預測問題。但是你怎么知道結果有什么好處呢? 您需要一個比較結果的基礎。您需要一個有意義的參考點來進行比較。 一旦開始從不同的機器學習算法中收集結果,基線結果可以告訴您更改是否正在增加值。 它如此簡單,卻如此強大。獲得基線后,您可以添加或更改數據屬性,正在嘗試的算法或算法參數,并了解您是否已改進了問題的方法或解決方案。 ## 計算基線結果 您可以使用常用方法計算基線結果。 基線結果是最簡單的預測。對于某些問題,這可能是隨機結果,而在其他問題中可能是最常見的預測。 * **分類**:如果您有分類問題,可以選擇觀察次數最多的類,并將該類用作所有預測的結果。在 [Weka](http://machinelearningmastery.com/how-to-run-your-first-classifier-in-weka/ "How to Run Your First Classifier in Weka") 中,這被稱為 [ZeroR](http://weka.sourceforge.net/doc.dev/weka/classifiers/rules/ZeroR.html) 。如果訓練數據集中所有類的觀察數相等,則可以選擇特定類或枚舉每個類,并查看哪個類在測試工具中提供了更好的結果。 * **回歸**:如果您正在處理回歸問題,您可以使用集中趨勢度量作為所有預測的結果,例如均值或中位數。 * **優化**:如果您正在處理優化問題,則可以在域中使用固定數量的隨機樣本。 您可以將寶貴的時間用于集體討論可以測試問題的所有最簡單的結果,然后繼續評估它們。結果可以是非常有效的過濾方法。如果更高級的建模方法不能勝過簡單的中心趨勢,那么您就知道自己有工作要做,最有可能更好地定義或重構問題。 您使用的[準確度分數](http://machinelearningmastery.com/classification-accuracy-is-not-enough-more-performance-measures-you-can-use/ "Classification Accuracy is Not Enough: More Performance Measures You Can Use")很重要。在計算基線之前,您必須選擇計劃使用的準確度分數。分數必須是相關的,并通過首先處理問題來告知您要回答的問題。 如果您正在處理分類問題,您可能需要查看 [Kappa統計量](http://en.wikipedia.org/wiki/Cohen's_kappa),它會為您提供基線標準化的準確度分數。基線準確度為0,高于零的分數顯示基線的改善。 ## 將結果與基線進行比較 如果您的基線結果不佳,則可以。它可能表明問題特別困難,或者可能意味著您的算法有很大的改進空間。 如果您無法獲得比基線更好的準確度,那么這很重要。這表明問題可能很難。 您可能需要收集更多或不同的數據來進行建模。您可能需要研究使用不同的,可能更強大的機器學習算法或算法配置。最終,經過這些類型的更改,您可能會遇到一個對預測有抵抗力的問題,可能需要重新構建。 ## 行動步驟 此帖子的操作步驟是開始使用基準調查下一個數據問題,您可以從中比較所有結果。 如果您已經在處理問題,請包含基線結果并使用該結果來解釋所有其他結果。 分享您的結果,您的問題是什么以及您使用的基線是什么?
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看