MNIST教程中的Tensorflow tf.matmul

Question

我是使用tensorflow的新手。 這是我的問題：

在MNIST教程中： https ://www.tensorflow.org/versions/master/get_started/mnist/beginners#mnist-for-ml-beginners：

首先，我們用表達式tf.matmul（x，W）將x乘以W。 這是從我們在方程中乘以Wx時得到的乘積翻轉過來的，這是處理x為具有多個輸入的2D張量的一個小技巧。 然后，我們添加b，最后應用tf.nn.softmax。

我的問題是：

為什么將b初始化為向量： b = tf.Variable(tf.zeros([10]))

而不是b = tf.Variable(tf.zeros([None,10]))或b = tf.Variable(tf.zeros([1,10]))嗎？

由於x * W + b的形狀為：[無，784] * [784，10] + [無，10]

感謝您的回答。

Answer 1

這是因為，我們對批次中的每個“圖像”（而不是批次）應用相同的操作。 因此x * W + b不是

[None , 784] * [784 , 10] + [None,10]

但是

results = merge(None, [784] * [784, 10] + [10])