# 線性模型
> 原文:[https://www.bookbookmark.ds100.org/ch/13/linear_models.html](https://www.bookbookmark.ds100.org/ch/13/linear_models.html)
```
# HIDDEN
# Clear previously defined variables
%reset -f
# Set directory for data loading to work properly
import os
os.chdir(os.path.expanduser('~/notebooks/13'))
```
既然我們有了將模型擬合到成本函數的一般方法,那么我們就將注意力轉向模型的改進。為了簡單起見,我們以前把自己局限于一個常量模型:我們的模型只預測一個數字。
然而,給我們的服務生這樣一個模特,他很難滿足。他可能會指出,他收集了更多關于他的桌子的信息,而不僅僅是小費百分比。為什么我們不使用他的其他數據,例如表的大小或總帳單,以使我們的模型更有用?
在本章中,我們將介紹線性模型,它將允許我們利用整個數據集進行預測。線性模型不僅在實踐中得到廣泛應用,而且具有豐富的理論基礎,使我們能夠理解未來的建模工具。我們引入了一個簡單的線性回歸模型,它使用一個解釋變量,解釋了如何使用梯度下降來擬合模型,最后將模型擴展為包含多個解釋變量。
- 一、數據科學的生命周期
- 二、數據生成
- 三、處理表格數據
- 四、數據清理
- 五、探索性數據分析
- 六、數據可視化
- Web 技術
- 超文本傳輸協議
- 處理文本
- python 字符串方法
- 正則表達式
- regex 和 python
- 關系數據庫和 SQL
- 關系模型
- SQL
- SQL 連接
- 建模與估計
- 模型
- 損失函數
- 絕對損失和 Huber 損失
- 梯度下降與數值優化
- 使用程序最小化損失
- 梯度下降
- 凸性
- 隨機梯度下降法
- 概率與泛化
- 隨機變量
- 期望和方差
- 風險
- 線性模型
- 預測小費金額
- 用梯度下降擬合線性模型
- 多元線性回歸
- 最小二乘-幾何透視
- 線性回歸案例研究
- 特征工程
- 沃爾瑪數據集
- 預測冰淇淋評級
- 偏方差權衡
- 風險和損失最小化
- 模型偏差和方差
- 交叉驗證
- 正規化
- 正則化直覺
- L2 正則化:嶺回歸
- L1 正則化:LASSO 回歸
- 分類
- 概率回歸
- Logistic 模型
- Logistic 模型的損失函數
- 使用邏輯回歸
- 經驗概率分布的近似
- 擬合 Logistic 模型
- 評估 Logistic 模型
- 多類分類
- 統計推斷
- 假設檢驗和置信區間
- 置換檢驗
- 線性回歸的自舉(真系數的推斷)
- 學生化自舉
- P-HACKING
- 向量空間回顧
- 參考表
- Pandas
- Seaborn
- Matplotlib
- Scikit Learn