## 1.2 統計數據能為我們做什么?
我們可以用統計數據做三件主要的事情:
* _ 描述 _:這個世界是復雜的,我們經常需要用我們能夠理解的簡單方式來描述它。
* _ 決定 _:我們通常需要根據數據做出決定,通常是在面臨不確定性的情況下。
* _ 預測 _:我們經常希望根據我們對以前情況的了解來預測新的情況。
讓我們來看一個實際的例子,集中在一個我們很多人都感興趣的問題上:我們如何決定吃什么是健康的?
有許多不同的指導來源,從政府飲食指南到飲食書籍,再到博客。
讓我們專注于一個特定的問題:我們飲食中的飽和脂肪是不是一件壞事?
我們回答這個問題的一種方法是常識。
如果我們吃脂肪,那么它會在我們的身體里直接變成脂肪,對嗎?
我們都看過脂肪堵塞動脈的照片,所以吃脂肪會阻塞動脈,對嗎?
我們回答這個問題的另一種方法是聽取權威人士的意見。美國食品藥品監督管理局的飲食指南作為其關鍵建議之一,“健康的飲食模式限制飽和脂肪的攝入”。你可能希望這些指南是基于良好的科學,在某些情況下是這樣的,但正如尼娜·泰克羅茲在她的書中概述的那樣。”大脂肪驚喜”(Teicholz,2014 年),這一特別建議似乎更多地基于營養研究人員的教條,而不是實際證據。
最后,我們可以看看實際的科學研究。讓我們先看一個名為“純粹研究”的大型研究,該研究對 18 個不同國家的 135000 多人的飲食和健康結果(包括死亡)進行了調查。在該數據集的一項分析中(發表于 2017 年的《柳葉刀》(The Lancet)(HTG1));Dehghan 等人(2017 年)),純研究人員報告了一項分析,分析了不同種類的宏量營養素(包括飽和脂肪和碳水化合物)的攝入與跟蹤調查期間死亡的可能性之間的關系。對受試者進行了中位數為 7.4 年的跟蹤調查,這意味著研究中一半受試者的跟蹤調查時間不足,一半受試者的跟蹤調查時間超過 7.4 年。圖[1.1](#fig:PureDeathSatFat)描繪了研究中的一些數據(摘自論文),顯示了飽和脂肪和碳水化合物攝入與任何原因死亡風險之間的關系。

圖 1.1 純研究的數據圖,顯示了任何原因導致的死亡與飽和脂肪和碳水化合物的相對攝入量之間的關系。
這個圖是以十個數字為基礎的。為了獲得這些數據,研究人員將 135335 名研究參與者(我們稱之為“樣本”)分成 5 組(“五分位數”),根據他們對任何一種營養素的攝入量對其進行排序;第一個五分位數包含 20%的最低攝入量的人,第五個五分位數包含 20%的最低攝入量的人。五分位數含有最高攝入量的 20%。然后,研究人員計算了在被跟蹤期間,每個研究小組中的人死亡的頻率。這個數字用死亡的相對風險(與最低五分位數相比)來表示這一點:如果這個數字大于 1,這意味著這個群體中的人比最低五分位數中的人死亡的可能性高 _,而如果這個數字小于 1,這意味著死亡的可能性比最低五分位數中的人高 _。也就是說,小組中的人死亡的可能性要小一些。這個數字非常清楚:在研究過程中,攝入飽和脂肪越多的人死亡的可能性就越小,而且吃得越多,這種影響就越大。碳水化合物的情況正好相反,一個人吃的碳水化合物越多,他們在研究中死亡的可能性就越大。這個例子顯示了我們如何使用統計數據來描述復雜的數據集,用一組簡單得多的數字來描述;如果我們必須同時查看來自每個研究參與者的數據,我們將被數據超載,很難看到 EME 當它們被更簡單地描述時。
圖[1.1](#fig:PureDeathSatFat)中的數字似乎表明,隨著飽和脂肪的攝入,死亡人數減少,而隨著碳水化合物的攝入,死亡人數增加,但我們也知道,數據中存在很多不確定性;有些人即使吃低碳水化合物的飲食,也會過早死亡,同樣,有些人甚至會因攝入低碳水化合物的食物而死亡。他吃了很多碳水化合物,但活到了成熟的老年。考慮到這種變異性,我們想 _ 決定 _ 我們在數據中看到的關系是否足夠大,如果飲食和壽命之間沒有真正的關系,我們就不會期望它們隨機發生。統計數據為我們提供了做出這些決定的工具,通常外界認為這是統計數據的主要目的。但正如我們將在書中看到的,基于模糊證據的黑白決策的需要常常導致研究人員誤入歧途。
基于這些數據,我們還想對未來的結果做出預測。例如,一家人壽保險公司可能想利用某個人攝入脂肪和碳水化合物的數據來預測他們的壽命。預測的一個重要方面是,它要求我們將已有的數據歸納為其他情況,通常是在將來;如果我們的結論僅限于某一特定時間研究中的特定人員,那么該研究就不會非常有用。一般來說,研究人員必須假設他們的特定樣本代表了更大的(htg0)群體(htg1),這要求他們以無偏見的方式獲取樣本。例如,如果純研究從信奉素食主義的宗教派別中招募了所有參與者,那么我們可能不想將結果推廣到遵循不同飲食標準的人身上。
- 前言
- 0.1 本書為什么存在?
- 0.2 你不是統計學家-我們為什么要聽你的?
- 0.3 為什么是 R?
- 0.4 數據的黃金時代
- 0.5 開源書籍
- 0.6 確認
- 1 引言
- 1.1 什么是統計思維?
- 1.2 統計數據能為我們做什么?
- 1.3 統計學的基本概念
- 1.4 因果關系與統計
- 1.5 閱讀建議
- 2 處理數據
- 2.1 什么是數據?
- 2.2 測量尺度
- 2.3 什么是良好的測量?
- 2.4 閱讀建議
- 3 概率
- 3.1 什么是概率?
- 3.2 我們如何確定概率?
- 3.3 概率分布
- 3.4 條件概率
- 3.5 根據數據計算條件概率
- 3.6 獨立性
- 3.7 逆轉條件概率:貝葉斯規則
- 3.8 數據學習
- 3.9 優勢比
- 3.10 概率是什么意思?
- 3.11 閱讀建議
- 4 匯總數據
- 4.1 為什么要總結數據?
- 4.2 使用表格匯總數據
- 4.3 分布的理想化表示
- 4.4 閱讀建議
- 5 將模型擬合到數據
- 5.1 什么是模型?
- 5.2 統計建模:示例
- 5.3 什么使模型“良好”?
- 5.4 模型是否太好?
- 5.5 最簡單的模型:平均值
- 5.6 模式
- 5.7 變異性:平均值與數據的擬合程度如何?
- 5.8 使用模擬了解統計數據
- 5.9 Z 分數
- 6 數據可視化
- 6.1 數據可視化如何拯救生命
- 6.2 繪圖解剖
- 6.3 使用 ggplot 在 R 中繪制
- 6.4 良好可視化原則
- 6.5 最大化數據/墨水比
- 6.6 避免圖表垃圾
- 6.7 避免數據失真
- 6.8 謊言因素
- 6.9 記住人的局限性
- 6.10 其他因素的修正
- 6.11 建議閱讀和視頻
- 7 取樣
- 7.1 我們如何取樣?
- 7.2 采樣誤差
- 7.3 平均值的標準誤差
- 7.4 中心極限定理
- 7.5 置信區間
- 7.6 閱讀建議
- 8 重新采樣和模擬
- 8.1 蒙特卡羅模擬
- 8.2 統計的隨機性
- 8.3 生成隨機數
- 8.4 使用蒙特卡羅模擬
- 8.5 使用模擬統計:引導程序
- 8.6 閱讀建議
- 9 假設檢驗
- 9.1 無效假設統計檢驗(NHST)
- 9.2 無效假設統計檢驗:一個例子
- 9.3 無效假設檢驗過程
- 9.4 現代環境下的 NHST:多重測試
- 9.5 閱讀建議
- 10 置信區間、效應大小和統計功率
- 10.1 置信區間
- 10.2 效果大小
- 10.3 統計能力
- 10.4 閱讀建議
- 11 貝葉斯統計
- 11.1 生成模型
- 11.2 貝葉斯定理與逆推理
- 11.3 進行貝葉斯估計
- 11.4 估計后驗分布
- 11.5 選擇優先權
- 11.6 貝葉斯假設檢驗
- 11.7 閱讀建議
- 12 分類關系建模
- 12.1 示例:糖果顏色
- 12.2 皮爾遜卡方檢驗
- 12.3 應急表及雙向試驗
- 12.4 標準化殘差
- 12.5 優勢比
- 12.6 貝葉斯系數
- 12.7 超出 2 x 2 表的分類分析
- 12.8 注意辛普森悖論
- 13 建模持續關系
- 13.1 一個例子:仇恨犯罪和收入不平等
- 13.2 收入不平等是否與仇恨犯罪有關?
- 13.3 協方差和相關性
- 13.4 相關性和因果關系
- 13.5 閱讀建議
- 14 一般線性模型
- 14.1 線性回歸
- 14.2 安裝更復雜的模型
- 14.3 變量之間的相互作用
- 14.4“預測”的真正含義是什么?
- 14.5 閱讀建議
- 15 比較方法
- 15.1 學生 T 考試
- 15.2 t 檢驗作為線性模型
- 15.3 平均差的貝葉斯因子
- 15.4 配對 t 檢驗
- 15.5 比較兩種以上的方法
- 16 統計建模過程:一個實例
- 16.1 統計建模過程
- 17 做重復性研究
- 17.1 我們認為科學應該如何運作
- 17.2 科學(有時)是如何工作的
- 17.3 科學中的再現性危機
- 17.4 有問題的研究實踐
- 17.5 進行重復性研究
- 17.6 進行重復性數據分析
- 17.7 結論:提高科學水平
- 17.8 閱讀建議
- References