該代碼有什么問題，為什么該代碼的損失沒有減少？

Question

我已經在張量流中實現了VGG-16，VGG-16是相當深的網絡，因此損耗肯定會減少。 但是在我的代碼中，它並沒有減少。 但是當我一次又一次地在同一批次上運行模型時，損失正在減少。 任何想法，為什么會發生這種事情。

VGG-net從這里開始。

對dog-vs-cat數據集進行了訓練，圖像尺寸為224x224x3。

網絡參數如下：

lr_rate：0.001 batch_size = 16

查找代碼@ GitHubGist

輸出如下：

Answer 1

我假設您正在遵循所鏈接的Simonyan＆Zisserman論文中的體系結構變體E-然后發現您的代碼存在一些問題：

pool13 = tf.layers.max_pooling2d(conv13, [2, 2], 2, name='pool13')

我沒有可供測試的GPU，但是經過足夠的迭代，損耗應該會減少。