<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                ThinkChat2.0新版上線,更智能更精彩,支持會話、畫圖、視頻、閱讀、搜索等,送10W Token,即刻開啟你的AI之旅 廣告
                # 統計假設檢驗的關鍵值以及如何在Python中計算它們 > 原文: [https://machinelearningmastery.com/critical-values-for-statistical-hypothesis-testing/](https://machinelearningmastery.com/critical-values-for-statistical-hypothesis-testing/) 如果不是標準的話,使用p值來解釋統計假設檢驗的結果是常見的。 并非所有統計測試的實現都返回p值。在某些情況下,您必須使用替代方法,例如關鍵值。此外,在估計群體觀測的預期間隔時使用臨界值,例如在公差間隔中。 在本教程中,您將發現關鍵值,它們重要的原因,它們的使用方式以及如何使用SciPy在Python中計算它們。 完成本教程后,您將了解: * 統計假設檢驗的例子及其可以計算和使用臨界值的分布。 * 如何在單尾和雙尾統計假設檢驗中使用準確的臨界值。 * 如何計算Gaussian,Student's t和Chi-Squared分布的臨界值。 讓我們開始吧。 ![A Gentle Introduction to Critical Values for Statistical Hypothesis Testing](img/baf3960287a2946722e201699c42252f.jpg) 統計假設檢驗關鍵值的溫和介紹 [Steve Bittinger](https://www.flickr.com/photos/sbittinger/16122347361/) 的照片,保留一些權利。 ## 教程概述 本教程分為4個部分;他們是: 1. 為什么我們需要關鍵價值觀? 2. 什么是關鍵價值? 3. 如何使用關鍵值 4. 如何計算臨界值 ## 為什么我們需要關鍵價值觀? 許多統計假設檢驗返回用于解釋檢驗結果的p值。 某些測試不返回p值,需要另一種方法來直接解釋計算的測試統計量。 通過統計假設檢驗計算的統計量可以使用來自檢驗統計量分布的臨界值來解釋。 統計假設檢驗的一些例子及其可以計算臨界值的分布如下: * **Z-Test** :高斯分布。 * **學生t檢驗**:學生t分布。 * **Chi-Squared Test** :Chi-Squared分布。 * **ANOVA** :F分布。 在為分布中的預期(或意外)觀察定義間隔時,也使用臨界值。在量化估計的統計量或間隔(例如置信區間和容差區間)的不確定性時,計算和使用臨界值可能是合適的。 ## 什么是關鍵價值? [臨界值](https://en.wikipedia.org/wiki/Critical_value)是在人口分布和概率的背景下定義的。 來自群體的觀察值,其具有等于或小于具有給定概率的臨界值的值。 我們可以用數學方式表達如下: ```py Pr[X <= critical value] = probability ``` 其中 _Pr_ 是概率的計算, _X_ 是來自群體的觀察, _critica_value_ 是計算的臨界值,_概率_是選擇概率。 使用數學函數計算臨界值,其中概率作為參數提供。對于大多數常見分布,無法通過分析計算該值;相反,它必須使用數值方法估算。從歷史上看,在統計教科書的附錄中提供預先計算的臨界值表是常見的,以供參考。 臨界值用于統計顯著性檢驗。概率通常表示為重要性,表示為小寫希臘字母alpha(a),它是反轉概率。 ```py probability = 1 - alpha ``` 計算臨界值時使用標準alpha值,由于歷史原因選擇并且由于一致性原因而不斷使用。這些alpha值包括: * 1%(alpha = 0.01) * 5%(alpha = 0.05) * 10%(alpha = 0.10) 臨界值提供了將統計假設檢驗解釋為 [p值](https://en.wikipedia.org/wiki/P-value)的替代和等效方法。 ## 如何使用關鍵值 計算的臨界值用作解釋統計檢驗結果的閾值。 超過臨界值的群體中的觀察值通常被稱為“_關鍵區域_”或“_拒絕區域_”。 > 臨界值:在表中出現的用于指定統計測試的值,指示可以拒絕原假設的計算值(計算的統計量落在拒絕區域中)。 - 第265頁,[研究方法手冊:社會科學從業者和學生指南](http://amzn.to/2G4vG4k),2003年。 統計檢驗可以是[單尾或雙尾](https://en.wikipedia.org/wiki/One-_and_two-tailed_tests)。 ### 單尾測試 單尾測試具有單個臨界值,例如分布的左側或右側。 通常,單尾測試在非對稱分布(例如Chi-Squared分布)的分布右側具有臨界值。 將統計值與計算的臨界值進行比較。如果統計量小于或等于臨界值,則統計檢驗的零假設未被拒絕。否則它被拒絕。 我們可以總結如下解釋: * **測試統計&lt;臨界值**:未能拒絕統計檢驗的零假設。 * **測試統計=&gt;臨界值**:拒絕統計檢驗的零假設。 ### 雙尾測試 雙尾檢驗具有兩個臨界值,分布的每一側有一個,通常假設它們是對稱的(例如高斯分布和學生t分布)。 使用雙尾測試時,計算臨界值時使用的顯著性水平(或alpha)必須除以2.臨界值將在分布的每一側使用此alpha的一部分。 為了使這個具體,請考慮5%的alpha。這將被分割為在分布的任一側給出2.5%的兩個α值,其中接收區域在分布的中間為95%。 我們可以將每個臨界值分別稱為分布左右的下臨界值和上臨界值。測試統計值大于或等于下臨界值且小于或等于上臨界值表示未能拒絕原假設。而測試統計值小于下臨界值且大于上臨界值表示拒絕測試的零假設。 We can summarize this interpretation as follows: * **降低CR&lt;測試統計&lt;上CR** :未拒絕統計檢驗的零假設。 * **測試統計&lt; =下CR OR測試統計&gt; =上CR** :拒絕統計測試的原假設。 如果測試統計量的分布在零均值附近對稱,那么我們可以通過將檢驗統計量的絕對值(正值)與上臨界值進行比較來快速檢查。 * **|測試統計| &LT;上臨界值**:未拒絕統計檢驗的零假設。 哪里 _|測試統計|_ 是計算的檢驗統計量的絕對值。 ## 如何計算臨界值 密度函數返回分布中觀察的概率。回想一下PDF和CDF的定義如下: * **概率密度函數(PDF)**:返回具有分布中特定值的觀測值的概率。 * **累積密度函數(CDF)**:返回觀察的概率等于或小于分布中的特定值。 為了計算臨界值,我們需要一個函數,給定概率(或重要性),將從分布中返回觀測值。 具體而言,我們需要累積密度函數的倒數,在給定概率的情況下,給出小于或等于概率的觀測值。這稱為百分點函數(PPF),或更一般地稱為[分位數函數](https://en.wikipedia.org/wiki/Quantile_function)。 * **百分點函數(PPF)**:返回所提供概率的觀測值,該概率小于或等于分布中提供的概率。 具體而言,來自分布的值將等于或小于具有指定概率的PPF返回的值。 讓我們通過三個分布來具體化,通常需要通過三個分布來計算臨界值。即,高斯分布,學生t分布和卡方分布。 我們可以使用給定分布上的 _ppf()_函數計算SciPy中的百分點函數。還應該注意的是,您還可以使用SciPy中名為 _isf()_的逆生存函數來計算 _ppf()_。這是提到的,因為您可能會在第三方代碼中看到這種替代方法的使用。 ## 高斯臨界值 下面的示例計算標準高斯分布上95%的百分點函數。 ```py # Gaussian Percent Point Function from scipy.stats import norm # define probability p = 0.95 # retrieve value <= probability value = norm.ppf(p) print(value) # confirm with cdf p = norm.cdf(value) print(p) ``` 運行該示例首先打印標記95%或更少的觀察值的值,該值來自約1.65的分布。然后通過從CDF檢索觀察的概率來確認該值,CDF按預期返回95%。 我們可以看到,1.65的值與我們對 [68-95-99.7規則](https://en.wikipedia.org/wiki/68%E2%80%9395%E2%80%9399.7_rule)中覆蓋95%分布的平均值的標準偏差數量的預期一致。 ```py 1.6448536269514722 0.95 ``` ### 學生的關鍵價值觀 下面的示例計算標準學生t分布的95%的百分點函數,具有10個自由度。 ```py # Student t-distribution Percent Point Function from scipy.stats import t # define probability p = 0.95 df = 10 # retrieve value <= probability value = t.ppf(p, df) print(value) # confirm with cdf p = t.cdf(value, df) print(p) ``` 運行該示例將返回大約1.812或更小的值,該值覆蓋所選分布中95%的觀察值。然后通過CDF確認該值的概率(具有較小的舍入誤差)。 ```py 1.8124611228107335 0.949999999999923 ``` ### 卡方臨界值 下面的示例計算了具有10個自由度的標準Chi-Squared分布的95%的百分點函數。 ```py # Chi-Squared Percent Point Function from scipy.stats import chi2 # define probability p = 0.95 df = 10 # retrieve value <= probability value = chi2.ppf(p, df) print(value) # confirm with cdf p = chi2.cdf(value, df) print(p) ``` 首先運行該示例計算的值為18.3或更小,覆蓋了分布中95%的觀測值。通過將其用作CDF的輸入來確認該觀察的概率。 ```py 18.307038053275143 0.95 ``` ## 進一步閱讀 如果您希望深入了解,本節將提供有關該主題的更多資源。 ### 圖書 * [研究方法手冊:社會科學從業者和學生指南](http://amzn.to/2G4vG4k),2003年。 ### API * [scipy.stats.norm API](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.norm.html) * [scipy.stats.t API](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.t.html) * [scipy.stats.chi2 API](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.chi2.html) ### 用品 * [維基百科的重要價值](https://en.wikipedia.org/wiki/Critical_value) * 維基百科上的 [P值](https://en.wikipedia.org/wiki/P-value) * [維基百科的單尾和雙尾測試](https://en.wikipedia.org/wiki/One-_and_two-tailed_tests) * 維基百科上的[分位數函數](https://en.wikipedia.org/wiki/Quantile_function) * 維基百科上的 [68-95-99.7規則](https://en.wikipedia.org/wiki/68%E2%80%9395%E2%80%9399.7_rule) ### 摘要 在本教程中,您發現了關鍵值,它們重要的原因,它們的使用方式以及如何使用SciPy在Python中計算它們。 具體來說,你學到了: * 統計假設檢驗的例子及其可以計算和使用臨界值的分布。 * 如何在單尾和雙尾統計假設檢驗中使用準確的臨界值。 * 如何計算Gaussian,Student's t和Chi-Squared分布的臨界值。 你有任何問題嗎? 在下面的評論中提出您的問題,我會盡力回答。
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看