model.eval() 在 pytorch 中做什么？

Question

我正在使用此代碼，並且在某些情況下看到了model.eval() 。

我知道它應該允許我“評估我的模型”，但我不明白什么時候應該和不應該使用它，或者如果關閉如何關閉。

我想運行上面的代碼來訓練網絡，並且還能夠在每個時期運行驗證。 我還是做不到。

Answer 1

model.eval()是模型的某些特定層/部分的一種開關，在訓練和推理（評估）期間表現不同。 例如，Dropouts Layers、BatchNorm Layers 等。您需要在模型評估期間關閉它們，而.eval()會為您完成。 此外，評估/驗證的常見做法是使用torch.no_grad()與model.eval()配對使用以關閉梯度計算：

# evaluate model:
model.eval()

with torch.no_grad():
    ...
    out_data = model(data)
    ...

但是，不要忘記在 eval 步驟后回到training模式：

# training step
...
model.train()
...

Answer 2

`model.train()`	`model.eval()`
在訓練模式下設置模型： • 標准化層¹使用每批統計數據 • 激活`Dropout`層²	集模型中的eval uation（推斷）模式： • 規范化層使用運行統計 • 停用`Dropout`層相當於`model.train(False)` 。

您可以通過運行model.train()關閉評估模式。 您應該在將模型作為推理引擎運行時使用它 - 即在測試、驗證和預測時（盡管實際上如果您的模型不包含任何不同行為的層，它不會有任何區別）。

^{例如BatchNorm , InstanceNorm}
^{這包括 RNN 模塊等的子模塊。}

Answer 3

model.eval是的方法torch.nn.Module ：

eval()

將模塊設置為評估模式。

這僅對某些模塊有任何影響。 如果它們受到影響，請參閱特定模塊的文檔以了解其在訓練/評估模式下的行為的詳細信息，例如Dropout 、 BatchNorm等。

這相當於self.train(False) 。

相反方法model.train通過曼·古普塔很好地說明。

Answer 4

對上述答案的額外補充：

我最近開始使用Pytorch-lightning ，它將大部分樣板包裝在訓練-驗證-測試管道中。

除此之外，它通過允許包裝eval和train的train_step和validation_step回調使model.eval()和model.train()幾乎是多余的，所以你永遠不會忘記。

model.eval() 在 pytorch 中做什么？

問題描述

4 個解決方案

解決方案1
153 已采納 2020-02-01 16:16:36

解決方案2
13 2021-03-28 15:38:47

解決方案3
10 2020-09-19 14:47:28

`eval()`

解決方案4
2 2021-01-17 15:56:31

model.eval() 在 pytorch 中做什么？

問題描述

4 個解決方案

解決方案1 153 已采納 2020-02-01 16:16:36

解決方案2 13 2021-03-28 15:38:47

解決方案3 10 2020-09-19 14:47:28

eval()

解決方案4 2 2021-01-17 15:56:31

解決方案1
153 已采納 2020-02-01 16:16:36

解決方案2
13 2021-03-28 15:38:47

解決方案3
10 2020-09-19 14:47:28

`eval()`

解決方案4
2 2021-01-17 15:56:31