11.1 生成模型 · 斯坦福 Stats60 21 世紀的統計思維

## 11.1 生成模型假設你走在街上，你的一個朋友路過，但沒有打招呼。你可能會試圖決定為什么會發生這種事——他們沒有看到你嗎？他們生你的氣嗎？你突然被一個魔法隱身盾牌遮住了嗎？貝葉斯統計背后的一個基本思想是，我們希望根據數據本身推斷出數據是如何生成的細節。在這種情況下，您希望使用數據（即，您的朋友沒有打招呼）來推斷生成數據的過程（例如，他們是否真的看到您，他們對您的感覺如何等）。生成模型背后的思想是，我們觀察由 _ 潛在的 _（看不見）過程生成的數據，通常在過程中具有一定的隨機性。事實上，當我們從一個群體中抽取一個數據樣本，并從樣本中估計一個參數時，我們所做的實質上是嘗試學習一個潛在變量（群體平均值）的值，這個潛在變量是通過對觀察到的數據（樣本平均值）進行抽樣而產生的。如果我們知道潛在變量的值，那么很容易重建觀測數據應該是什么樣子。例如，假設我們在拋硬幣，我們知道這是公平的。我們可以用 p=0.5 的二項式分布來描述硬幣，然后我們可以從這種分布中生成隨機樣本，以觀察觀察到的數據應該是什么樣的。然而，總的來說，我們處于相反的情況：我們不知道潛在的利益變量的價值，但我們有一些數據，我們想用來估計它。