在教程中編寫的Pytorch model.train（）和separte train（）函數

Question

我是PyTorch的新手，我想知道您是否可以向我解釋PyTorch中的默認model.train（）與此處的train（）函數之間的一些關鍵區別。

另一個train（）函數在有關文本分類的官方PyTorch教程上，並且對於在訓練結束時是否存儲模型權重感到困惑。

https://pytorch.org/tutorials/intermediate/char_rnn_classification_tutorial.html

learning_rate = 0.005

criterion = nn.NLLLoss()

def train(category_tensor, line_tensor):
    hidden = rnn.initHidden()
    rnn.zero_grad()
    for i in range(line_tensor.size()[0]):
        output, hidden = rnn(line_tensor[i], hidden)
    loss = criterion(output, category_tensor)
    loss.backward()
    # Add parameters' gradients to their values, multiplied by learning rate
    for p in rnn.parameters():
        p.data.add_(-learning_rate, p.grad.data)
    return output, loss.item()

這就是功能。 然后以以下形式多次調用此函數：

n_iters = 100000
print_every = 5000
plot_every = 1000
record_every = 500

# Keep track of losses for plotting
current_loss = 0
all_losses = []
predictions = []
true_vals = []

def timeSince(since):
    now = time.time()
    s = now - since
    m = math.floor(s / 60)
    s -= m * 60
    return '%dm %ds' % (m, s)

start = time.time()

for iter in range(1, n_iters + 1):
    category, line, category_tensor, line_tensor = randomTrainingExample()
    output, loss = train(category_tensor, line_tensor)
    current_loss += loss

    if iter % print_every == 0:
        guess, guess_i = categoryFromOutput(output)
        correct = 'O' if guess == category else 'X (%s)' % category
        print('%d %d%% (%s) %.4f %s / %s %s' % (iter, iter / n_iters * 100, timeSince(start), loss, line, guess, correct))

    if iter % plot_every == 0:
        all_losses.append(current_loss / plot_every)
        current_loss = 0

    if iter % record_every == 0:
        guess, guess_i = categoryFromOutput(output)
        predictions.append(guess)
        true_vals.append(category)

在我看來，模型權重並沒有保存或更新，而是在每次迭代時都被這樣寫時覆蓋。 這個對嗎？ 還是該模型似乎正在正確訓練？

另外，如果我要使用默認函數model.train（），主要的優點是什么，model.train（）執行的功能與上面的train（）函數大致相同嗎？

Answer 1

根據此處的源代碼， model.train()將模塊設置為訓練模式。 因此，它基本上告訴您的模型您正在訓練模型。 這具有僅在某些模塊，如任何效果dropout ， batchnorm等，其表現不同的訓練/評估模式。 對於model.train() ，模型知道必須學習層。

您可以調用model.eval()或model.train(mode=False)來告訴模型它沒有新知識要學習，並且該模型用於測試目的。

model.train()只是設置模式。 它實際上並沒有訓練模型。

上面使用的train()實際上是訓練模型，即計算梯度並進行反向傳播以學習權重。

了解更多關於model.train()從官方pytorch論壇，在這里。

在教程中編寫的Pytorch model.train（）和separte train（）函數

問題描述

1 個解決方案

解決方案1
1 2019-06-25 17:32:22

在教程中編寫的Pytorch model.train（）和separte train（）函數

問題描述

1 個解決方案

解決方案1 1 2019-06-25 17:32:22

解決方案1
1 2019-06-25 17:32:22