千層面的學習率衰減

Question

我正在使用Nesterov動量來更新卷積神經網絡的權重。 我正在使用Lasagne構建CNN。 如何實現每個時期的學習率衰減？

prediction = lasagne.layers.get_output(network)
loss = lasagne.objectives.categorical_crossentropy(prediction, target_var)
params = lasagne.layers.get_all_params(network, trainable=True)
lasagne.updates.nesterov_momentum(loss, params, learning_rate, momentum=0.9)
train_fn = theano.function([input_var_1, input_var_2, target_var], loss, updates=updates)

Answer 1

將學習率定義為圖形元素

...
learning_rate = T.scalar(name='learning_rate')
updates = lasagne.updates.nesterov_momentum(loss, params, learning_rate, momentum=0.9)
...

將您的學習率節點添加到train_fn

train_fn = theano.function([input_var_1, input_var_2, target_var, learning_rate], loss, updates=updates)

現在，您可以調整學習率，例如：

base_lr = 1e-4
lr_decay = 0.8

for epoch in range(epochs):
    lr = base_lr * (lr_decay ** epoch)
    loss, updates = train_fn(input_1, input_2, target, lr)

Answer 2

我認為您缺少了一些東西：

prediction = lasagne.layers.get_output(network)
loss = lasagne.objectives.categorical_crossentropy(prediction, target_var)
params = lasagne.layers.get_all_params(network, trainable=True)
updates = lasagne.updates.nesterov_momentum(loss, params, learning_rate, momentum=0.9)
train_fn = theano.function([input_var_1, input_var_2, target_var], loss, updates=updates)

千層面的學習率衰減

問題描述

2 個解決方案

解決方案1
3 2016-06-02 15:01:57

解決方案2
0 2016-05-30 22:15:15

千層面的學習率衰減

問題描述

2 個解決方案

解決方案1 3 2016-06-02 15:01:57

解決方案2 0 2016-05-30 22:15:15

解決方案1
3 2016-06-02 15:01:57

解決方案2
0 2016-05-30 22:15:15