3.8 數據學習 · 斯坦福 Stats60 21 世紀的統計思維

## 3.8 數據學習另一種看待 Bayes 法則的方法是根據數據更新我們的信仰——也就是說，利用數據了解世界。讓我們再看一下貝葉斯法則： ![](https://img.kancloud.cn/3f/65/3f652f299830ba669cdc98b06689339e_208x43.jpg) Bayes 規則的不同部分有特定的名稱，這與它們在使用 Bayes 規則更新我們信仰中的作用有關。我們首先對 b（![](https://img.kancloud.cn/86/a3/86a3af5a929b52752acd66597f289026_42x18.jpg)）的概率進行初步猜測，我們稱之為 _ 先驗 _ 概率。在變壓吸附的例子中，我們使用了之前的基本速率，因為在我們知道測試結果之前這是我們最好的猜測。然后我們收集一些數據，在我們的示例中是測試結果。數據 A 與結果 B 的一致程度由![](https://img.kancloud.cn/12/33/1233a94dfd4f821db649c4da23016eaf_60x19.jpg)給出，我們稱之為 _ 可能性 _。你可以把這看作是數據的可能性，考慮到特定的假設正在被檢驗。在我們的例子中，被測試的假設是個體是否患有癌癥，可能性是基于我們對測試特殊性的了解。分母（![](https://img.kancloud.cn/1e/53/1e53fa24f0bc77f0b1a9464d61693b01_40x18.jpg)）被稱為 _ 邊際似然 _，因為它表示數據的總體似然性，在 a 的所有可能值（在我們的示例中是正的和負的測試結果）中取平均值。左邊的結果（![](https://img.kancloud.cn/d5/ce/d5ce7f3cf292fb982d6f6addb911a417_60x19.jpg)）被稱為 _ 后面的 _——因為它是計算的后端。有另一種方法來編寫貝葉斯規則，使這一點更加清晰： ![](https://img.kancloud.cn/3b/92/3b920d24912ebdd449910df7a51ffd60_208x43.jpg) 左邊的部分（![](https://img.kancloud.cn/1f/5d/1f5df8ca36ff925f4d3f5609a8967479_61x43.jpg)）告訴我們，相對于數據的總體（邊際）可能性，A 被賦予的可能性有多大，或者更少；右邊的部分（![](https://img.kancloud.cn/86/a3/86a3af5a929b52752acd66597f289026_42x18.jpg)）告訴我們，我們認為 B（在我們了解數據之前）的可能性有多大。這就更清楚了，貝葉斯定理的作用是根據數據比整體更可能被賦予 b 的程度來更新我們的先驗知識。