15 比較方法 · 斯坦福 Stats60 21 世紀的統計思維

# 15 比較方法在統計學中，我們要問的最常見的問題之一是兩個不同組的平均值是否存在差異。假設我們想知道經常吸食大麻的人是否會看更多的電視。我們可以使用 nhanes 數據集來問這個問題；讓我們從數據集中抽取 200 個人的樣本，測試每天看電視的時間是否與正常使用大麻有關。圖[15.1](#fig:PotTVViolin)顯示了使用小提琴繪圖的這些數據。 ```r # create sample with tv watching and marijuana use NHANES_sample <- NHANES_adult %>% drop_na(TVHrsDay, RegularMarij) %>% mutate( TVHrsNum = recode( #recode character values into numerical values TVHrsDay, "More_4_hr" = 5, "4_hr" = 4, "2_hr" = 2, "1_hr" = 1, "3_hr" = 3, "0_to_1_hr" = 0.5, "0_hrs" = 0 ) ) %>% sample_n(200) ``` ![Violin plot showing distributions of TV watching separated by regular marijuana use.](https://img.kancloud.cn/df/ef/dfef54295daffea04b73fcc740b242ef_384x384.png) 圖 15.1 顯示電視觀看分布的小提琴圖，由正常的大麻使用分開。