給定一些訓練數據和一種網絡架構,很多組權重值(即很多**模型**)都可以解釋這些數據。
**簡單模型**比復雜模型更不容易過擬合。
*****
## **權重正則化**(weight regularization):
**簡單模型**(simple model)是指參數值分布的熵更小的模型
強制讓模型權重只能取較小的值,從而限制模型的復雜度,這使得權重值的分布更加**規則**
* 向網絡損失函數中添加與較大權重值相關的**成本**(cost)
**成本**(cost):
* **L1 正則化**(L1 regularization):添加的成本與**權重系數的絕對值**[權重的**L1 范數**(norm)]成正比。
* **L2 正則化**(L2 regularization):添加的成本與**權重系數的平方**(權重的**L2 范數**)成正比,又稱**權重衰減**(weight decay)
在Keras中使用:添加權重正則化的方法是向層傳遞**權重正則化項實例**(weight regularizer instance)作為關鍵字參數
~~~
model.add(layers.Dense(16, kernel_regularizer=regularizers.l2(0.001),
activation='relu', input_shape=(10000,)))
~~~
kernel_regularizer=regularizers.l2(0.001):
`l2(0.001)`的意思是該層權重矩陣的每個系數都會使網絡總損失增加`0.001 * weight_coefficient_value`
- 基礎
- 張量tensor
- 整數序列(列表)=>張量
- 張量運算
- 張量運算的幾何解釋
- 層:深度學習的基礎組件
- 模型:層構成的網絡
- 訓練循環 (training loop)
- 數據類型與層類型、keras
- Keras
- Keras 開發
- Keras使用本地數據
- fit、predict、evaluate
- K 折 交叉驗證
- 二分類問題-基于梯度的優化-訓練
- relu運算
- Dens
- 損失函數與優化器:配置學習過程的關鍵
- 損失-二分類問題
- 優化器
- 過擬合 (overfit)
- 改進
- 小結
- 多分類問題
- 回歸問題
- 章節小結
- 機械學習
- 訓練集、驗證集和測試集
- 三種經典的評估方法
- 模型評估
- 如何準備輸入數據和目標?
- 過擬合與欠擬合
- 減小網絡大小
- 添加權重正則化
- 添加 dropout 正則化
- 通用工作流程
- 計算機視覺
- 卷積神經網絡
- 卷積運算
- 卷積的工作原理
- 訓練一個卷積神經網絡
- 使用預訓練的卷積神經網絡
- VGG16
- VGG16詳細結構
- 為什么不微調整個卷積基?
- 卷積神經網絡的可視化
- 中間輸出(中間激活)
- 過濾器
- 熱力圖
- 文本和序列
- 處理文本數據
- n-gram
- one-hot 編碼 (one-hot encoding)
- 標記嵌入 (token embedding)
- 利用 Embedding 層學習詞嵌入
- 使用預訓練的詞嵌入
- 循環神經網絡
- 循環神經網絡的高級用法
- 溫度預測問題
- code
- 用卷積神經網絡處理序列
- GRU 層
- LSTM層
- 多輸入模型
- 回調函數
- ModelCheckpoint 與 EarlyStopping
- ReduceLROnPlateau
- 自定義回調函數
- TensorBoard_TensorFlow 的可視化框架
- 高級架構模式
- 殘差連接
- 批標準化
- 批再標準化
- 深度可分離卷積
- 超參數優化
- 模型集成
- LSTM
- DeepDream
- 神經風格遷移
- 變分自編碼器
- 生成式對抗網絡
- 術語表