## 3.2 我們如何確定概率?
既然我們知道了概率是什么,那么我們如何才能真正知道任何特定事件的概率是什么呢?
### 3.2.1 個人意見
假設我問你,如果伯尼·桑德斯獲得民主黨提名而不是希拉里·克林頓的話,他在 2016 年贏得美國總統大選的可能性有多大。這里的樣本空間是桑德斯贏了,桑德斯輸了,但我們實際上不能做實驗來找到結果。然而,大多數了解選舉的人都愿意對這一事件的可能性進行猜測。在許多情況下,個人知識和/或意見是我們確定事件發生概率的唯一指南,但這在科學上并不令人滿意。
### 3.2.2 經驗頻率
另一種確定事件發生概率的方法是多次進行實驗,并計算每個事件發生的頻率。根據不同結果的相對頻率,我們可以計算出每個結果的概率。比如說,我們有興趣知道舊金山下雨的可能性。首先,我們必須定義實驗---假設我們將在 2017 的每一天查看國家氣象服務數據(可以從 [HTTPS://www. NCDC.NOAAGOV/](https://www.ncdc.noaa.gov/)下載),并確定在舊金山市中心的氣象站是否有雨。
```r
# load data on rain in San Francisco and compute probability
SFrain <- read_csv("data/SanFranciscoRain/1329219.csv")
# create a new variable indicating whether it rained on each day
SFrain <-
SFrain %>%
mutate(rainToday = as.integer(PRCP > 0))
SFrain_summary <-
SFrain %>%
summarize(
nRainyDays = sum(rainToday),
nDaysMeasured = n(),
pRainInSF = nRainyDays / nDaysMeasured
)
pander(SFrain_summary)
```
<colgroup><col style="width: 18%"> <col style="width: 22%"> <col style="width: 15%"></colgroup>
| 每天 | 標準測量值 | 普拉寧斯 |
| --- | --- | --- |
| 73 | 365 個 | 0.2 條 |
根據這些數據,2017 年有 73 個雨天。為了計算舊金山的降雨概率,我們簡單地將雨天數除以(365),給出 P(SF 的雨在 2017)=0.2。
我們怎么知道經驗概率給了我們正確的數字?這個問題的答案來自于 _ 大數定律 _,它表明隨著樣本量的增加,經驗概率將接近真實概率。我們可以通過模擬大量的硬幣翻轉來看到這一點,并查看我們對每次翻轉后頭部概率的估計。在后面的章節中,我們將花費更多的時間討論模擬;現在,假設我們有一種計算方法來為每個硬幣翻轉生成隨機結果。

圖 3.1 大數定律的演示。一枚硬幣被翻轉了 30000 次,每次翻轉后,頭部的概率是根據收集到的頭部和尾部的數量來計算的。以 0.5 的真實概率結算的概率大約需要 15000 次翻轉。
圖[3.1](#fig:FlipSim)顯示,隨著樣本數量(即硬幣翻轉試驗)的增加,頭部的估計概率收斂到 0.5 的真實值。但是,請注意,當樣本量較小時,估計值可能與真實值相差甚遠。在 2017 年佐治亞州美國參議院特別選舉中,看到了一個現實世界的例子,這場選舉讓共和黨人羅伊·摩爾與民主黨人道格·瓊斯相提并論。圖[3.2](#fig:ElectionResults)顯示了隨著越來越多的選票被計算在內,當晚每個候選人所報告的選票的相對數量。晚上早些時候,投票數特別不穩定,從瓊斯最初的領先優勢到摩爾領先的很長一段時間,直到瓊斯最終領先贏得比賽。

圖 3.2 2017 年 12 月 12 日美國佐治亞州參議院席位特別選舉的投票相對比例,與選區報告百分比的函數關系。這些數據摘自[https://www.ajc.com/news/national/alabama-senate-race-live-updates-roy-moore-doug-jones/kpfkdaweixicw3fhjxqi/](https://www.ajc.com/news/national/alabama-senate-race-live-updates-roy-moore-doug-jones/KPRfkdaweoiXICW3FHjXqI/)
這兩個例子表明,雖然大樣本最終會收斂于真實概率,但小樣本的結果可能會相差很遠。不幸的是,許多人忘記了這一點,并曲解了小樣本的結果。心理學家丹尼·卡尼曼和阿莫斯·特沃斯基(Danny Kahneman and Amos Tversky)稱之為“小數字定律”(HTG0),他們發現人們(甚至是受過訓練的研究人員)的行為通常就好像大數字定律甚至適用于小樣本一樣,對小數據集的結果給予了過多的信任。.在整個過程中,我們將看到一些例子,說明在小樣本的基礎上生成統計結果會有多不穩定。
### 3.2.3 經典概率
我們中的任何一個人都不太可能投過幾萬次硬幣,但我們仍然愿意相信,倒頭的概率是 0.5。這反映了另一種計算概率的方法的使用,我們稱之為 _ 經典概率 _。在這種方法中,我們直接根據我們對形勢的了解來計算概率。
經典概率源于對骰子和紙牌等機會游戲的研究。一個著名的例子來自一個法國賭徒遇到的一個問題,這個賭徒的名字是“chevalier de m_r_”。德瑪 _r_ 玩了兩種不同的骰子游戲:第一種是在六面骰子的四個骰子上賭至少一個六的機會,第二種是在兩個骰子的 24 個骰子上賭至少一個六的機會。他希望在這兩次賭博中都能贏,但他發現,盡管他在第一次賭博中平均贏了錢,但在第二次賭博中卻多次輸了錢。為了理解這一點,他求助于他的朋友,數學家布萊斯·帕斯卡,他現在被公認為概率論的創始人之一。
我們如何用概率論來理解這個問題?在經典概率論中,我們首先假設樣本空間中的所有基本事件都同樣可能發生;也就是說,當您滾動一個骰子時,所有可能的結果(1,2,3,4,5,6)都同樣可能發生。(不允許加載骰子!)考慮到這一點,我們可以將任何單個結果的概率計算為:

對于六面模具,每個單獨結果的概率為 1/6。
這很好,但是 de m_r_ 對更復雜的事件感興趣,比如多個骰子擲骰子時發生的事情。我們如何計算復雜事件(單個事件的聯合)的概率,比如在第一個 _ 或 _ 中滾動一個事件或第二個事件?De M_r_ 認為(錯誤地,我們將在下面看到),他可以簡單地將單個事件的概率相加,以計算組合事件的概率,這意味著在第一卷或第二卷上滾動一個事件的概率將計算如下:

De M_r_ 基于此推斷,四卷中至少六卷的概率是每個單卷的概率之和:。同樣地,他推斷,因為擲骰子時兩個 6 的概率是 1/36,那么兩個骰子的 24 卷骰子中至少一個 6 的概率是。然而,盡管他總是在第一次下注中贏了錢,但在第二次下注中卻輸了錢。什么給予?
為了理解 de m_r_ 的誤差,我們需要引入概率論的一些規則。第一個是減法規則(htg0),即:

其中表示“非 a”。這個規則直接從我們上面討論的公理中推導出來;因為 a 和是唯一可能的結果,所以它們的總概率必須加為 1。例如,如果在一次投擲中滾動一個物體的概率是,那么滾動除一個物體以外的任何物體的概率是。
第二條規則告訴我們如何計算聯合事件的概率——也就是說,兩個事件同時發生的概率。這個版本的規則告訴我們,在特殊情況下,當兩個事件彼此獨立時,如何計算這個量;我們稍后將確切地了解 _ 獨立性 _ 的概念意味著什么,但現在我們可以想當然地認為這兩個擲模是不獨立的。ndent 事件。

因此,向兩個輥中的每一輥投擲六個輥的概率是。
第三條規則告訴我們如何將概率相加——這里我們看到了 de m_r_ 錯誤的來源。加法規則告訴我們:

也就是說,A 或 B 發生的概率是通過將單個概率相加,然后減去兩者同時發生的可能性來確定的。在某種意義上,這會阻止我們將這些實例計數兩次。假設我們想找出在兩個投擲中的任何一個上滾動 6 的概率。根據我們的規則:

圖 3.3 這個矩陣中的每個單元格表示一個 die 的兩次 throw 的一個結果,其中列表示第一次 throw,行表示第二次 throw。淺藍色顯示的單元格表示第一次或第二次投擲中有一個單元格的單元格;其余的單元格顯示為深藍色。
讓我們使用一個圖形化的描述來獲得這個規則的不同視圖。圖[3.3](#fig:ThrowMatrix)顯示了一個表示所有可能拋出的矩陣,并突出顯示了在第一次或第二次拋出中涉及一個拋出的單元格。如果你用淺藍色數數這些細胞,你會發現有 11 個這樣的細胞。這說明了為什么加法規則給出了與 de m_r_ 不同的答案;如果我們像他那樣簡單地把兩次擲骰的概率相加,那么我們將對兩次擲骰都計算(1,1),而實際上只計算一次。
### 3.2.4 解決 de m_r_ 的問題
布萊斯·帕斯卡利用概率法則提出了一個解決德瑪·R·_ 問題的方法。首先,他意識到,從一個組合中計算出至少一個事件的概率是很困難的,而計算出某個事件在多個事件中不發生的概率相對來說比較容易——這只是單個事件概率的乘積。因此,他不是計算四卷中至少六卷的概率,而是計算所有卷中沒有混亂的概率:

然后,他利用四卷紙中無六個的概率是四卷紙中至少六個六個的補數(因此必須求和為一),并使用減法規則計算利息概率:

德瑪 __ 賭他會投至少六分之一的骰子的概率大于 0.5,這解釋了德瑪 ____ 為什么在這個賭注上平均賺錢。
但是,德姆雷爾的第二個賭注呢?帕斯卡使用了同樣的技巧:

這一結果的概率略低于 0.5,這說明了為什么在這場賭博中,de m_r_ 平均賠錢。
- 前言
- 0.1 本書為什么存在?
- 0.2 你不是統計學家-我們為什么要聽你的?
- 0.3 為什么是 R?
- 0.4 數據的黃金時代
- 0.5 開源書籍
- 0.6 確認
- 1 引言
- 1.1 什么是統計思維?
- 1.2 統計數據能為我們做什么?
- 1.3 統計學的基本概念
- 1.4 因果關系與統計
- 1.5 閱讀建議
- 2 處理數據
- 2.1 什么是數據?
- 2.2 測量尺度
- 2.3 什么是良好的測量?
- 2.4 閱讀建議
- 3 概率
- 3.1 什么是概率?
- 3.2 我們如何確定概率?
- 3.3 概率分布
- 3.4 條件概率
- 3.5 根據數據計算條件概率
- 3.6 獨立性
- 3.7 逆轉條件概率:貝葉斯規則
- 3.8 數據學習
- 3.9 優勢比
- 3.10 概率是什么意思?
- 3.11 閱讀建議
- 4 匯總數據
- 4.1 為什么要總結數據?
- 4.2 使用表格匯總數據
- 4.3 分布的理想化表示
- 4.4 閱讀建議
- 5 將模型擬合到數據
- 5.1 什么是模型?
- 5.2 統計建模:示例
- 5.3 什么使模型“良好”?
- 5.4 模型是否太好?
- 5.5 最簡單的模型:平均值
- 5.6 模式
- 5.7 變異性:平均值與數據的擬合程度如何?
- 5.8 使用模擬了解統計數據
- 5.9 Z 分數
- 6 數據可視化
- 6.1 數據可視化如何拯救生命
- 6.2 繪圖解剖
- 6.3 使用 ggplot 在 R 中繪制
- 6.4 良好可視化原則
- 6.5 最大化數據/墨水比
- 6.6 避免圖表垃圾
- 6.7 避免數據失真
- 6.8 謊言因素
- 6.9 記住人的局限性
- 6.10 其他因素的修正
- 6.11 建議閱讀和視頻
- 7 取樣
- 7.1 我們如何取樣?
- 7.2 采樣誤差
- 7.3 平均值的標準誤差
- 7.4 中心極限定理
- 7.5 置信區間
- 7.6 閱讀建議
- 8 重新采樣和模擬
- 8.1 蒙特卡羅模擬
- 8.2 統計的隨機性
- 8.3 生成隨機數
- 8.4 使用蒙特卡羅模擬
- 8.5 使用模擬統計:引導程序
- 8.6 閱讀建議
- 9 假設檢驗
- 9.1 無效假設統計檢驗(NHST)
- 9.2 無效假設統計檢驗:一個例子
- 9.3 無效假設檢驗過程
- 9.4 現代環境下的 NHST:多重測試
- 9.5 閱讀建議
- 10 置信區間、效應大小和統計功率
- 10.1 置信區間
- 10.2 效果大小
- 10.3 統計能力
- 10.4 閱讀建議
- 11 貝葉斯統計
- 11.1 生成模型
- 11.2 貝葉斯定理與逆推理
- 11.3 進行貝葉斯估計
- 11.4 估計后驗分布
- 11.5 選擇優先權
- 11.6 貝葉斯假設檢驗
- 11.7 閱讀建議
- 12 分類關系建模
- 12.1 示例:糖果顏色
- 12.2 皮爾遜卡方檢驗
- 12.3 應急表及雙向試驗
- 12.4 標準化殘差
- 12.5 優勢比
- 12.6 貝葉斯系數
- 12.7 超出 2 x 2 表的分類分析
- 12.8 注意辛普森悖論
- 13 建模持續關系
- 13.1 一個例子:仇恨犯罪和收入不平等
- 13.2 收入不平等是否與仇恨犯罪有關?
- 13.3 協方差和相關性
- 13.4 相關性和因果關系
- 13.5 閱讀建議
- 14 一般線性模型
- 14.1 線性回歸
- 14.2 安裝更復雜的模型
- 14.3 變量之間的相互作用
- 14.4“預測”的真正含義是什么?
- 14.5 閱讀建議
- 15 比較方法
- 15.1 學生 T 考試
- 15.2 t 檢驗作為線性模型
- 15.3 平均差的貝葉斯因子
- 15.4 配對 t 檢驗
- 15.5 比較兩種以上的方法
- 16 統計建模過程:一個實例
- 16.1 統計建模過程
- 17 做重復性研究
- 17.1 我們認為科學應該如何運作
- 17.2 科學(有時)是如何工作的
- 17.3 科學中的再現性危機
- 17.4 有問題的研究實踐
- 17.5 進行重復性研究
- 17.6 進行重復性數據分析
- 17.7 結論:提高科學水平
- 17.8 閱讀建議
- References