簡體   English   中英

MNIST教程中的Tensorflow tf.matmul

[英]Tensorflow tf.matmul in MNIST tutorial

我是使用tensorflow的新手。 這是我的問題:

在MNIST教程中: https ://www.tensorflow.org/versions/master/get_started/mnist/beginners#mnist-for-ml-beginners:

首先,我們用表達式tf.matmul(x,W)將x乘以W。 這是從我們在方程中乘以Wx時得到的乘積翻轉過來的,這是處理x為具有多個輸入的2D張量的一個小技巧。 然后,我們添加b,最后應用tf.nn.softmax。

我的問題是:

為什么將b初始化為向量: b = tf.Variable(tf.zeros([10]))

而不是b = tf.Variable(tf.zeros([None,10]))b = tf.Variable(tf.zeros([1,10]))嗎?

由於x * W + b的形狀為:[無,784] * [784,10] + [無,10]

感謝您的回答。

這是因為,我們對批次中的每個“圖像”(而不是批次)應用相同的操作。 因此x * W + b不是

[None , 784] * [784 , 10] + [None,10]

但是

results = merge(None, [784] * [784, 10] + [10])

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM