<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                ??一站式輕松地調用各大LLM模型接口,支持GPT4、智譜、豆包、星火、月之暗面及文生圖、文生視頻 廣告
                # 數據,學習和建模 > 原文: [https://machinelearningmastery.com/data-learning-and-modeling/](https://machinelearningmastery.com/data-learning-and-modeling/) 機器學習中的關鍵概念為理解該領域奠定了基礎。 在這篇文章中,您將學習在描述數據和數據集時使用的命名法(標準術語)。 您還將學習用于描述數據學習和建模的概念和術語,這些概念和術語將為您在機器學習領域的旅程提供有價值的直覺。 ## 數據 機器學習方法從實例中學習。掌握輸入數據和描述數據時使用的各種術語非常重要。在本節中,您將學習在引用數據時機器學習中使用的術語。 當我想到數據時,我會想到行和列,比如數據庫表或Excel電子表格。這是一種傳統的數據結構,是機器學習領域的常見結構。目前不考慮其他數據,如圖像,視頻和文本,即所謂的非結構化數據。 ![Table of Data Showing an Instance, Feature, and Train-Test Datasets](https://img.kancloud.cn/40/6e/406eb2077f534094ccdab4021476720e_771x398.jpg) 顯示實例,功能和訓練測試數據集的數據表 **實例**:單行數據稱為實例。這是來自領域的觀察。 **功能**:單列數據稱為功能。它是觀察的一個組成部分,也稱為數據實例的屬性。一些特征可以是模型的輸入(預測變量),而其他特征可以是輸出或要預測的特征。 **數據類型**:功能具有數據類型。它們可以是實數或整數值,也可以具有分類或序數值。您可以使用字符串,日期,時間和更復雜的類型,但在使用傳統的機器學習方法時,通常會將它們簡化為實際值或分類值。 **數據集**:實例集合是一個數據集,在使用機器學習方法時,我們通常需要一些數據集用于不同的目的。 **Training Dataset** :我們提供給我們的機器學習算法的數據集,用于訓練我們的模型。 **測試數據集**:我們用于驗證模型準確性但不用于訓練模型的數據集。它可以稱為驗證數據集。 我們可能必須收集實例來形成我們的數據集,或者我們可能會得到一個必須拆分為子數據集的有限數據集。 ## 學習 機器學習確實是關于算法的自動學習。 在本節中,我們將考慮一些關于學習的高級概念。 **歸納**:機器學習算法通過一個稱為歸納或歸納學習的過程來學習。歸納是一種推理過程,它根據特定信息(訓練數據)進行概括(模型)。 **泛化**:需要泛化,因為機器學習算法準備的模型需要根據訓練期間未見的特定數據實例進行預測或決策。 **過度學習**:當模型過于仔細地學習訓練數據而不進行概括時,這稱為過度學習。結果是除了訓練數據集之外的數據表現不佳。這也稱為過度擬合。 **學習不足**:當模型沒有從數據庫中學到足夠的結構,因為學習過程提前終止,這稱為學習不足。結果是良好的泛化,但所有數據(包括訓練數據集)的表現都很差。這也稱為欠配合。 **在線學習**:在線學習是指在域可用時使用域中的數據實例更新方法。在線學習需要對噪聲數據具有魯棒性的方法,但可以生成與域的當前狀態更加一致的模型。 **離線學習**:離線學習是指在預先準備好的數據上創建方法,然后在未觀察到的數據上進行操作。由于訓練數據的范圍是已知的,因此可以控制并且可以仔細調整訓練過程。準備好后,模型不會更新,如果域名發生變化,表現可能會下降。 **監督學習**:這是一個學習過程,用于概括需要預測的問題。 “教學過程”將模型的預測與已知答案進行比較,并在模型中進行校正。 **無監督學習**:這是一個學習過程,用于推廣數據中不需要預測的結構。識別和利用自然結構以將實例相互關聯。 在[機器學習算法](http://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/ "A Tour of Machine Learning Algorithms")上發表之前,我們已經介紹了有監督和無監督學習。這些術語可用于按行為對算法進行分類。 ## 造型 由機器學習過程創建的人工制品本身可以被視為一個程序。 **模型選擇**:我們可以將模型配置和訓練過程視為模型選擇過程。每次迭代我們都有一個新模型,我們可以選擇使用或修改。甚至機器學習算法的選擇也是該模型選擇過程的一部分。在針對問題存在的所有可能模型中,所選訓練數據集上的給定算法和算法配置將提供最終選擇的模型。 **感應偏差**:偏差是對所選模型施加的限制。所有模型都有偏差,這會在模型中引入誤差,并且根據定義,所有模型都有誤差(它們是觀察的概括)。通過模型中的一般化引入偏差,包括模型的配置和生成模型的算法的選擇。機器學習方法可以創建具有低偏差或高偏差的模型,并且可以使用策略來減少高偏差模型的偏差。 **模型方差**:方差是模型對訓練數據的敏感程度。在數據集上創建模型時,機器學習方法可以具有高或低的方差。減少模型方差的策略是在具有不同初始條件的數據集上多次運行,并將平均精度作為模型表現。 **偏差 - 方差權衡**:模型選擇可以被認為是偏差和方差的權衡。低偏差模型將具有高差異并且需要長時間或多次訓練以獲得可用模型。高偏差模型將具有較低的方差并且將快速訓練,但是遭受差的且有限的表現。 ## 資源 如果您想深入挖掘,下面是一些資源。 * Tom Mitchell,[學習概括中存在偏見的需要](http://scholar.google.com/scholar?q=The+need+for+biases+in+learning+generalizations ),1980 * [了解偏差 - 方差權衡](http://scott.fortmann-roe.com/docs/BiasVariance.html) 這篇文章提供了一個有用的術語表,您可以隨時參考這些術語以獲得清晰的定義。 是否缺少條款?您是否對所列條款之一有更清晰的描述?發表評論,讓我們都知道。
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看