3.10 多層感知機的簡潔實現 · 動手學深度學習--pytorch

# 3.10 多層感知機的簡潔實現下面我們使用Gluon來實現上一節中的多層感知機。首先導入所需的包或模塊。 ``` python import torch from torch import nn from torch.nn import init import numpy as np import sys sys.path.append("..") import d2lzh_pytorch as d2l ``` ## 3.10.1 定義模型和softmax回歸唯一的不同在于，我們多加了一個全連接層作為隱藏層。它的隱藏單元個數為256，并使用ReLU函數作為激活函數。 ``` python num_inputs, num_outputs, num_hiddens = 784, 10, 256 net = nn.Sequential( d2l.FlattenLayer(), nn.Linear(num_inputs, num_hiddens), nn.ReLU(), nn.Linear(num_hiddens, num_outputs), ) for params in net.parameters(): init.normal_(params, mean=0, std=0.01) ``` ## 3.10.2 讀取數據并訓練模型我們使用與3.7節中訓練softmax回歸幾乎相同的步驟來讀取數據并訓練模型。 > 注：由于這里使用的是PyTorch的SGD而不是d2lzh_pytorch里面的sgd，所以就不存在3.9節那樣學習率看起來很大的問題了。 ``` python batch_size = 256 train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size) loss = torch.nn.CrossEntropyLoss() optimizer = torch.optim.SGD(net.parameters(), lr=0.5) num_epochs = 5 d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, None, None, optimizer) ``` 輸出： ``` epoch 1, loss 0.0030, train acc 0.712, test acc 0.744 epoch 2, loss 0.0019, train acc 0.823, test acc 0.821 epoch 3, loss 0.0017, train acc 0.844, test acc 0.842 epoch 4, loss 0.0015, train acc 0.856, test acc 0.842 epoch 5, loss 0.0014, train acc 0.864, test acc 0.818 ``` ## 小結 * 通過PyTorch可以更簡潔地實現多層感知機。 ----------- > 注：本節除了代碼之外與原書基本相同，[原書傳送門](https://zh.d2l.ai/chapter_deep-learning-basics/mlp-gluon.html)