<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                企業??AI智能體構建引擎,智能編排和調試,一鍵部署,支持知識庫和私有化部署方案 廣告
                # 更好的樸素貝葉斯:從樸素貝葉斯算法中獲取最多的12個技巧 > 原文: [https://machinelearningmastery.com/better-naive-bayes/](https://machinelearningmastery.com/better-naive-bayes/) Naive Bayes是一種簡單而強大的技術,您應該在分類問題上進行測試和使用。 它易于理解,可以提供良好的結果,并且可以快速構建模型并進行預測。僅出于這些原因,您應該仔細查看算法。 在最近的博客文章中,[學習了如何在python](http://machinelearningmastery.com/naive-bayes-classifier-scratch-python/ "How To Implement Naive Bayes From Scratch in Python") 中從頭開始實現Naive Bayes算法。 在這篇文章中,您將學習從Naive Bayes算法中獲得最大收益的技巧和竅門。 [![Better Naive Bayes](img/407cd2016e6e4e31481076cfa4675a2d.jpg)](https://3qeqpr26caki16dnhd19sv6by6v-wpengine.netdna-ssl.com/wp-content/uploads/2014/12/Better-Naive-Bayes.jpg) 更好的樸素貝葉斯 攝影:[鄧肯赫爾](https://www.flickr.com/photos/dullhunk/6097248541),保留一些權利 ## 1.缺少數據 樸素貝葉斯可以處理丟失的數據。 在模型構建時和預測時,算法分別處理屬性。 因此,如果數據實例具有屬性的缺失值,則可以在準備模型時將其忽略,并在計算類值的概率時忽略。 ## 2.使用日志概率 概率通常很小。要計算聯合概率,您需要將概率相乘。當您將一個小數字乘以另一個小數字時,您得到的數字非常小。 浮點值的精度可能會遇到困難,例如欠載。要避免此問題,請在對數概率空間中工作(取概率的對數)。 這是有效的,因為要在樸素貝葉斯進行預測,我們需要知道哪個類具有更大的概率(等級)而不是特定概率。 ## 獲取免費算法思維導圖 ![Machine Learning Algorithms Mind Map](img/2ce1275c2a1cac30a9f4eea6edd42d61.jpg) 方便的機器學習算法思維導圖的樣本。 我已經創建了一個由類型組織的60多種算法的方便思維導圖。 下載,打印并使用它。 ## 3.使用其他分配 要將Naive Bayes與分類屬性一起使用,您需要計算每個觀察的頻率。 要將樸素貝葉斯與實值屬性一起使用,您可以使用高斯分布來匯總屬性的密度。或者,您可以使用另一種更好地描述數據分布的函數形式,例如指數。 不要將自己局限于Naive Bayes算法示例中使用的分布。選擇最能表征您的數據和預測問題的分布。 ## 4.使用概率進行特征選擇 特征選擇是選擇最能表征預測變量的數據屬性。 在Naive Bayes中,每個屬性的概率都是獨立于訓練數據集計算的。您可以使用搜索算法將不同屬性的概率組合在一起,并在預測輸出變量時評估其表現。 ## 5.細分數據 他們的數據明確定義是否能夠很好地響應Naive Bayes概率方法? 通過簡單的概率方法(如Naive Bayes)識別和分離易于處理的段可以提高表現并關注更難以建模的問題元素。 探索不同的子集,例如Naive Bayes很可能處理的平均或流行案例。 ## 6.重新計算概率 計算每個屬性的概率非常快。 樸素貝葉斯的這種好處意味著您可以在數據發生變化時重新計算概率。這可能是每月,每天,甚至每小時。 這對于其他算法來說可能是不可想象的,但是如果在建模的問題中存在一些時間漂移,則應該在使用樸素貝葉斯時進行測試。 ## 7.用作生成模型 Naive Bayes方法表征了問題,而這又可以用于對看不見的數據進行預測。 該概率表征也可用于生成問題的實例。 在數字向量的情況下,可以對概率分布進行采樣以創建新的虛構向量。 在文本(Naive Bayes的一個非常流行的應用程序)的情況下,該模型可用于創建虛構的輸入文檔。 這對你的問題有什么用? 至少,您可以使用生成方法來幫助提供模型所表征的背景。 ## 8.刪除冗余功能 如果數據包含高度相關的特征,樸素貝葉斯的表現會降低。 這是因為高度相關的特征在模型中被投票兩次,而不是夸大它們的重要性。 使用相關矩陣相互評估屬性的相關性,并刪除那些相關性最高的特征。 盡管如此,總是在這樣的變化之前和之后測試你的問題,并堅持使用導致更好結果的問題形式。 ## 9.并行化概率計算 每個屬性的概率是獨立計算的。這是方法中的獨立性假設以及它的名稱“樸素”的原因。 您可以通過并行計算屬性概率來利用此假設來進一步加速算法的執行。 根據數據集和資源的大小,您可以使用不同的CPU,不同的計算機或不同的集群來執行此操作。 ## 10.比您想象的更少的數據 Naive Bayes不需要很多數據就能很好地運行。 它需要足夠的數據來理解與輸出變量隔離的每個屬性的概率關系。 鑒于模型中忽略了屬性之間的交互,我們不需要這些交互的示例,因此通常比其他算法(例如邏輯回歸)更少的數據。 此外,不太可能以較小的樣本尺寸過度擬合訓練數據。 如果您沒有太多的訓練數據,請嘗試Naive Bayes。 ## 11.零觀測問題 如果屬性分布與訓練數據集相比存在顯著差異,那么樸素貝葉斯將不可靠。 一個重要的例子是分類屬性具有在訓練中未觀察到的值的情況。在這種情況下,模型將分配0概率并且無法進行預測。 應檢查這些案例并以不同方式處理。在解決了這些案例后(已知答案),應重新計算概率并更新模型。 ## 12.無論如何它都有效 關于Naive Bayes的一個有趣觀點是,即使違反了獨立性假設并且屬性之間存在明確的已知關系,它仍然有效。 重要的是,這是您需要[在給定問題上檢查各種算法](http://machinelearningmastery.com/why-you-should-be-spot-checking-algorithms-on-your-machine-learning-problems/ "Why you should be Spot-Checking Algorithms on your Machine Learning Problems")的原因之一,因為結果很可能會讓您大吃一驚。 ## 摘要 在這篇文章中,您學到了很多關于如何使用和從Naive Bayes算法中獲得更多信息的知識。 你有一些使用本文未涉及的樸素貝葉斯的技巧和提示發表評論。
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看