<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                合規國際互聯網加速 OSASE為企業客戶提供高速穩定SD-WAN國際加速解決方案。 廣告
                ## 5.3 什么使模型“良好”? 從我們的統計模型中,我們通常需要兩種不同的東西。首先,我們希望它能夠很好地描述我們的數據;也就是說,我們希望它在建模數據時具有盡可能低的錯誤。第二,我們希望它能夠很好地概括為新的數據集;也就是說,當我們將其應用于新的數據集時,我們希望它的錯誤盡可能低。事實證明,這兩個特性經常會發生沖突。 為了理解這一點,讓我們考慮一下錯誤的來源。首先,如果我們的模型是錯誤的,就可能發生這種情況;例如,如果我們不準確地說身高隨年齡而下降而不是上升,那么我們的錯誤將高于正確模型的錯誤。同樣,如果我們的模型中缺少一個重要因素,這也會增加我們的誤差(就像我們把年齡從模型中排除在身高之外時那樣)。然而,即使模型是正確的,誤差也可能發生,因為數據的隨機變化,我們通常稱之為“測量誤差”或“噪聲”。有時,這實際上是由于我們的測量誤差造成的——例如,當測量值依賴于人時,例如使用秒表測量競走中經過的時間。在其他情況下,我們的測量設備是高度精確的(像測量體重的數字秤),但被測量的東西受到許多不同因素的影響,這些因素導致它是可變的。如果我們知道所有這些因素,那么我們就可以建立一個更精確的模型,但事實上,這幾乎不可能。 讓我們用一個例子來說明這一點。我們不使用實際數據,而是為示例生成一些數據;我們將在本課程后面更詳細地討論模擬數據的生成。假設我們想了解一個人的血液酒精含量(BAC)和他們在模擬駕駛考試中的反應時間之間的關系。我們可以生成一些模擬數據并繪制關系圖(參見圖[5.5](#fig:BACrt)的面板 A)。 ![Simulated relationship between blood alcohol content and reaction time on a driving test, with best-fitting linear model. A: linear relationship with low measurement error. B: linear relationship with higher measurement error. C: Nonlinear relationship with low measurement error and (incorrect) linear model](https://img.kancloud.cn/cc/03/cc03de28482f078d2ef42fd846190502_576x576.png) 圖 5.5 駕駛試驗中血液酒精含量與反應時間的模擬關系,最佳擬合線性模型。A:線性關系,測量誤差小。B:線性關系,測量誤差較大。C:具有低測量誤差和(不正確)線性模型的非線性關系 在這個例子中,反應時間隨血液中的酒精含量而有系統地增加——藍線表示最合適的模型,我們可以看到誤差很小,這很明顯,所有的點都非常接近這條線。 我們也可以想象數據顯示相同的線性關系,但有更多的誤差,如圖[5.5](#fig:BACrt)的面板 B 所示。在這里,我們看到仍然有一個系統的反應時間增加與細菌,但它是更多的個人變量。 這兩個例子都是 _ 線性模型 _ 似乎合適的,并且誤差反映了我們測量中的噪聲。線性模型規定兩個變量之間的關系遵循直線。例如,在線性模型中,無論 BAC 的級別如何,BAC 的變化總是與反應時間的特定變化相關。 另一方面,還有其他情況下線性模型是不正確的,并且由于沒有正確地指定模型,誤差會增加。假設我們對咖啡因攝入量和測試表現之間的關系感興趣。咖啡因等興奮劑與測試成績之間的關系往往是非線性的,也就是說,它不遵循直線。這是因為隨著咖啡因含量的減少(當這個人變得更加警覺時),工作表現也會隨之上升,但隨著咖啡因含量的增加(當這個人變得緊張和緊張時),工作表現也會開始下降。我們可以模擬這種形式的數據,然后將線性模型擬合到數據中(參見圖[5.5](#fig:BACrt)的面板 C)。藍線表示最符合這些數據的直線;顯然,存在高度錯誤。雖然在測試表現和咖啡因攝入量之間有著非常合法的關系,但它是一條曲線而不是一條直線。線性模型誤差很大,因為它是這些數據的錯誤模型。
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看