Python中效果大小度量的溫和介紹 · Machine Learning Mastery 博客文章翻譯

# Python中效果大小度量的溫和介紹 > 原文： [https://machinelearningmastery.com/effect-size-measures-in-python/](https://machinelearningmastery.com/effect-size-measures-in-python/) 統計假設檢驗報告了假設觀察結果的可能性，例如變量之間沒有關聯或組間沒有差異。如果關聯或差異具有統計學意義，則假設檢驗不會評估效果的大小。這突出了對計算和報告結果的標準方法的需求。效應大小方法是指用于量化實驗結果中效應大小的一套統計工具，可用于補充統計假設檢驗的結果。在本教程中，您將發現用于量化結果大小的效果大小和效果大小度量。完成本教程后，您將了解： * 在實驗結果中計算和報告效應大小的重要性。 * 效應大小度量用于量化變量之間的關聯，例如Pearson相關系數。 * 用于量化組間差異的效應大小度量，例如Cohen的d度量。讓我們開始吧。 ![A Gentle Introduction to Effect Size Measures in Python](img/d61aa2b531f0504780eb0b0103ef13e6.jpg) Python中效果大小測量的溫和介紹 [scott1346](https://www.flickr.com/photos/bluecorvette/8345369485/) 的照片，保留一些權利。 ## 教程概述本教程分為三個部分;他們是： 1. 需要報告效果大小 2. 什么是效果大小？ 3. 如何計算效果大小 ## 需要報告效果大小一旦從業者熟悉統計方法，通常會專注于量化結果的可能性。這通常可以通過統計假設檢驗的結果的計算和表示來看待p值和顯著性水平。在結果呈現中經常被忽略的一個方面是實際量化差異或關系，稱為效果。很容易忘記實驗的目的是量化效果。 > 研究調查的主要產品是效果大小的一個或多個度量，而不是P值。 - [我學到的東西（到目前為止）](https://tech.me.holycross.edu/files/2015/03/Cohen_1990.pdf)，1990。統計檢驗只能評論是否存在影響。它沒有評論效果的大小。實驗結果可能很重要，但影響很小，幾乎沒有后果。 > 結果在統計上顯著且微不足道是可能的，并且不幸的是很常見。結果在統計上也可能是非顯著且重要的。 - 第4頁，[影響大小的基本指南：統計力量，Meta分析和研究結果的解釋](https://amzn.to/2JDcwSe)，2010。忽略效果呈現的問題在于它可以使用臨時測量來計算或者甚至完全被忽略并留給讀者解釋。這是一個很大的問題，因為量化效果的大小對于解釋結果至關重要。 ## 什么是效果大小？效應大小是指預期在群體中發生的效果或結果的大小或大小。效果大小是根據數據樣本估算的。效果大小方法是指用于計算效果大小的統計工具的集合。通常，效應大小測量的領域被簡稱為“_效應大小_”，以注意該領域的普遍關注。基于要量化的效果類型，將效應大小統計方法組織成組是常見的。計算效果大小的兩組主要方法是： * **協會**。用于量化變量之間的關聯的統計方法（例如，相關性）。 * **差異**。量化變量之間差異的統計方法（例如均值之間的差異）。 > 效果可以是在組（例如治療組和未治療組）之間比較中顯示的治療結果，或者它可以描述兩個相關變量（例如治療劑量和健康）之間的關聯程度。 - 第5頁，[影響大小的基本指南：統計力量，Meta分析和研究結果的解釋](https://amzn.to/2JDcwSe)，2010。必須解釋效果大小計算的結果，并且它取決于所使用的特定統計方法。必須根據解釋的目標選擇一項措施。三種計算結果包括： * **標準化結果**。效果大小具有標準比例，允許一般地解釋它而不管應用（例如，科恩的計算）。 * **原始單位結果**。效果大小可以使用變量的原始單位，這可以有助于域內的解釋（例如，兩個樣本均值之間的差異）。 * **單位免費結果**。效果大小可以不具有諸如計數或比例（例如，相關系數）的單位。 > 因此，效果大小可以指群組平均值或絕對效果大小之間的原始差異，以及標準化效果度量，其被計算以將效果轉換為易于理解的量表。當研究中的變量具有內在意義（例如，睡眠小時數）時，絕對效應大小是有用的。 - [使用效果大小 - 或為什么P值不夠](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3444174/)，2012。使用多種方法報告效果大小以幫助您的研究結果的不同類型的讀者可能是個好主意。 > 有時，最好以原始單位報告結果，以便于讀者理解，以及在未來的元分析中易于包含的一些標準化措施。 - 第41頁，[了解新統計：影響大小，置信區間和元分析](https://amzn.to/2v0wKSI)，2011。效應大小不會取代統計假設檢驗的結果。相反，效果大小補充了測試。理想情況下，假設檢驗和效應大小計算的結果將并排顯示。 * **假設檢驗**：量化給定假設（零假設）觀察數據的可能性。 * **效果大小**：假設效果存在，量化效果的大小。 ## 如何計算效果大小效應大小的計算可以是樣本平均值的計算或兩個平均值之間的絕對差值。它也可以是更精細的統計計算。在本節中，我們將查看關聯和差異的一些常見效果大小計算。方法的例子不完整;可能有100種方法可用于計算效果大小。 ### 計算關聯效果大小變量之間的關聯通常被稱為效應大小方法的“ _r家族_”。這個名字來自于計算效果大小的最常用方法，稱為Pearson相關系數，也稱為Pearson's r。 Pearson相關系數衡量兩個實值變量之間的線性關聯程度。它是一種無單位效應大小度量，可以按標準方式解釋，如下所示： * -1.0：完美的負面關系。 * -0.7：強烈的負面關系 * -0.5：適度的負面關系 * -0.3：弱關系 * 0.0：沒有關系。 * 0.3：弱關系 * 0.5：適度的積極關系 * 0.7：積極的關系 * 1.0：完美的積極關系。 Pearson的相關系數可以使用 [pearsonr（）SciPy函數](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.pearsonr.html)在Python中計算。下面的例子演示了Pearson相關系數的計算，以量化兩個隨機高斯數樣本之間關聯的大小，其中一個樣本與第二個樣本有很強的關系。 ```py # calculate the Pearson's correlation between two variables from numpy.random import randn from numpy.random import seed from scipy.stats import pearsonr # seed random number generator seed(1) # prepare data data1 = 10 * randn(10000) + 50 data2 = data1 + (10 * randn(10000) + 50) # calculate Pearson's correlation corr, _ = pearsonr(data1, data2) print('Pearsons correlation: %.3f' % corr) ``` 運行該示例計算并打印兩個數據樣本之間的Pearson相關性。我們可以看到效果顯示樣本之間存在強烈的正相關關系。 ```py Pearson’s correlation: 0.712 ``` 用于計算關聯效應大小的另一種非常流行的方法是r平方測量，或r ^ 2，也稱為確定系數。它總結了另一個變量解釋的一個變量的方差比例。 ### 計算差異效應大小組之間的差異通常被稱為效應大小方法的“ _d家族_”。這個名字來自于計算群體平均值之間差異的最常用方法，稱為Cohen's d。科恩測量兩個高斯分布變量的均值之間的差異。它是一個標準分數，總結了標準偏差數量的差異。由于分數是標準化的，因此有一個表格可以解釋結果，總結如下： * **小效應尺寸**：d = 0.20 * **中等效應大小**：d = 0.50 * **大效應尺寸**：d = 0.80 Python中沒有提供Cohen的計算;我們可以手動計算。計算兩個樣本的平均值之間的差異如下： ```py d = (u1 - u2) / s ``` _d_ 是Cohen的d， _u1_ 是第一個樣本的平均值， _u2_ 是第二個樣本的平均值， _s_ ]是兩個樣品的合并標準偏差。兩個獨立樣本的合并標準偏差可以計算如下： ```py s = sqrt(((n1 - 1) . s1^2 + (n2 - 1) . s2^2) / (n1 + n2 - 2)) ``` 是合并的標準偏差， _n1_ 和 _n2_ 是第一個樣本和第二個樣本和 _s1 ^ 2_ 的大小和 _s2 ^ 2_ 是第一個和第二個樣本的方差。減法是對自由度數的調整。下面的函數將計算兩個實值變量樣本的Cohen d度量。 NumPy函數 [mean（）](https://docs.scipy.org/doc/numpy/reference/generated/numpy.mean.html)和 [var（）](https://docs.scipy.org/doc/numpy/reference/generated/numpy.var.html)分別用于計算樣本均值和方差。 ```py # function to calculate Cohen's d for independent samples def cohend(d1, d2): # calculate the size of samples n1, n2 = len(d1), len(d2) # calculate the variance of the samples s1, s2 = var(d1, ddof=1), var(d2, ddof=1) # calculate the pooled standard deviation s = sqrt(((n1 - 1) * s1 + (n2 - 1) * s2) / (n1 + n2 - 2)) # calculate the means of the samples u1, u2 = mean(d1), mean(d2) # calculate the effect size return (u1 - u2) / s ``` 下面的例子計算了具有不同均值的兩個隨機高斯變量樣本的Cohen d度量。設計該實例使得平均值相差半個標準差，并且兩個樣本具有相同的標準偏差。 ```py # calculate the Cohen's d between two samples from numpy.random import randn from numpy.random import seed from numpy import mean from numpy import var from math import sqrt # function to calculate Cohen's d for independent samples def cohend(d1, d2): # calculate the size of samples n1, n2 = len(d1), len(d2) # calculate the variance of the samples s1, s2 = var(d1, ddof=1), var(d2, ddof=1) # calculate the pooled standard deviation s = sqrt(((n1 - 1) * s1 + (n2 - 1) * s2) / (n1 + n2 - 2)) # calculate the means of the samples u1, u2 = mean(d1), mean(d2) # calculate the effect size return (u1 - u2) / s # seed random number generator seed(1) # prepare data data1 = 10 * randn(10000) + 60 data2 = 10 * randn(10000) + 55 # calculate cohen's d d = cohend(data1, data2) print('Cohens d: %.3f' % d) ``` 運行該示例計算并打印Cohen的效果大小。我們可以看到，正如預期的那樣，均值之間的差異是被解釋為中等效應大小的一個標準差的一半。 ```py Cohen's d: 0.500 ``` 量化差異效應大小的另外兩種流行方法是： * **優勢比**。測量一種治療結果與另一種治療相比的可能性。 * **相對風險比**。測量一種治療方法與另一種治療方法相比的可能性。 ## 擴展本節列出了一些擴展您可能希望探索的教程的想法。 * 在研究論文中查找報告效果大小以及統計顯著性結果的示例。 * 實現一個函數來計算配對樣本的Cohen d并在測試數據集上進行演示。 * 實施并演示另一種差異效應指標，例如賠率或風險比率。如果你探索任何這些擴展，我很想知道。 ## 進一步閱讀如果您希望深入了解，本節將提供有關該主題的更多資源。 ### 文件 * [使用效果大小 - 或為什么P值不夠](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3444174/)，2012。 * [我學到的東西（到目前為止）](https://tech.me.holycross.edu/files/2015/03/Cohen_1990.pdf)，1990。 ### 圖書 * [影響大小的基本指南：統計力量，Meta分析和研究結果的解釋](https://amzn.to/2JDcwSe)，2010。 * [了解新統計：影響大小，置信區間和元分析](https://amzn.to/2v0wKSI)，2011。 * [行為科學的統計功效分析](https://amzn.to/2GNcmtu)，1988。 ### API * [scipy.stats.pearsonr（）API](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.pearsonr.html) * [numpy.var（）API](https://docs.scipy.org/doc/numpy/reference/generated/numpy.var.html) * [numpy.mean（）API](https://docs.scipy.org/doc/numpy/reference/generated/numpy.mean.html) ### 用品 * [維基百科上的效果大小](https://en.wikipedia.org/wiki/Effect_size) ## 摘要在本教程中，您發現了用于量化結果大小的效果大小和效果大小度量。具體來說，你學到了： * 在實驗結果中計算和報告效應大小的重要性。 * 效應大小度量用于量化變量之間的關聯，例如Pearson相關系數。 * 用于量化組間差異的效應大小度量，例如Cohen的d度量。你有任何問題嗎？在下面的評論中提出您的問題，我會盡力回答。