在**訓練數據**上**訓練模型** => 在**驗證數據**上**評估模型**,一旦找到了最佳參數=>就在**測試數據**上最后**測試**一次。
*****
#### **為什么不是兩個集合:一個訓練集和一個測試集?**~~在訓練集上訓練模型,然后在測試集上評估模型~~
因為在于開發模型時**總是需要調節**模型配置:選擇層數或每層大小(模型的超參數(hyperparameter),以便與模型參數(即權重)區分開),這個調節過程需要使用模型在驗證數據上的**性能**作為**反饋信號**。
這個調節過程本質上就是一種**學習**:在某個參數空間中尋找良好的模型配置。
=》基于模型在**驗證集**上的**性能**來**調節**模型配置,會很快導致模型**在驗證集上過擬合**,即使你并沒有在驗證集上直接訓練模型也會如此。
**信息泄露**(information leak):
每次基于模型在驗證集上的性能來調節模型超參數,都會有一些**關于驗證數據的信息**泄露到模型中。
最后,你得到的模型在驗證集上的性能非常好(**人為造成的**)
- 基礎
- 張量tensor
- 整數序列(列表)=>張量
- 張量運算
- 張量運算的幾何解釋
- 層:深度學習的基礎組件
- 模型:層構成的網絡
- 訓練循環 (training loop)
- 數據類型與層類型、keras
- Keras
- Keras 開發
- Keras使用本地數據
- fit、predict、evaluate
- K 折 交叉驗證
- 二分類問題-基于梯度的優化-訓練
- relu運算
- Dens
- 損失函數與優化器:配置學習過程的關鍵
- 損失-二分類問題
- 優化器
- 過擬合 (overfit)
- 改進
- 小結
- 多分類問題
- 回歸問題
- 章節小結
- 機械學習
- 訓練集、驗證集和測試集
- 三種經典的評估方法
- 模型評估
- 如何準備輸入數據和目標?
- 過擬合與欠擬合
- 減小網絡大小
- 添加權重正則化
- 添加 dropout 正則化
- 通用工作流程
- 計算機視覺
- 卷積神經網絡
- 卷積運算
- 卷積的工作原理
- 訓練一個卷積神經網絡
- 使用預訓練的卷積神經網絡
- VGG16
- VGG16詳細結構
- 為什么不微調整個卷積基?
- 卷積神經網絡的可視化
- 中間輸出(中間激活)
- 過濾器
- 熱力圖
- 文本和序列
- 處理文本數據
- n-gram
- one-hot 編碼 (one-hot encoding)
- 標記嵌入 (token embedding)
- 利用 Embedding 層學習詞嵌入
- 使用預訓練的詞嵌入
- 循環神經網絡
- 循環神經網絡的高級用法
- 溫度預測問題
- code
- 用卷積神經網絡處理序列
- GRU 層
- LSTM層
- 多輸入模型
- 回調函數
- ModelCheckpoint 與 EarlyStopping
- ReduceLROnPlateau
- 自定義回調函數
- TensorBoard_TensorFlow 的可視化框架
- 高級架構模式
- 殘差連接
- 批標準化
- 批再標準化
- 深度可分離卷積
- 超參數優化
- 模型集成
- LSTM
- DeepDream
- 神經風格遷移
- 變分自編碼器
- 生成式對抗網絡
- 術語表