ValueError：尺寸必須相等，但對於'mul'來說必須為4096和9。為什么這里沒有廣播？

Question

我有一個非常簡單的示例：

import tensorflow as tf
import pdb

number_features = tf.random_uniform((4096,22))

probs = number_features
probs_L = probs[:,:3]
probs_S1 = probs[:,3:12]
probs_S2 = probs[:,12:22]

confidence_no_digits = probs_L[:,0]
confidence_single_digit = probs_L[:,1] * probs_S1

with tf.Session() as sess:
    result = sess.run([confidence_single_digit])

但這給出了：

ValueError：尺寸必須相等，但對於輸入形狀為[4096]，[4096,9]的“ mul”（操作：“ Mul”），尺寸必須為4096和9。

為什么不能將元素大小為[4096]的向量和大小為[4096,9]的矩陣相乘。 為什么廣播在這里不起作用？

Answer 1

張量流中的廣播遵循與NumPy廣播相同的模式。 當對兩個數組進行運算時，它會從最后一個維度開始逐個元素地比較它們的形狀，然后一直到第一個維度。 在以下情況下，兩個維度兼容：

它們相等，或者
其中之一是1，或者
一維缺失

在這種情況下，根據上述規則，從最后一個尺寸開始，尺寸4096（第一個數組的最后一個尺寸）和9（第二個數組的最后一個尺寸）不兼容，因此會出現錯誤。

為了修復它以獲得所需的廣播效果，可以將第一個數組轉換為具有兼容的形狀：

confidence_single_digit = tf.expand_dims(probs_L[:,1],1) * probs_S1

因此形狀分別為（4096，1）和（4096，9）。

Answer 2

如果我沒記錯的話， *符號表示按元素進行乘法，而您要進行矩陣乘法。 您應該使用TF的矩陣乘法函數matmul 。

嘗試：

confidence_single_digit = tf.matmul(probs_L[:,1], probs_S1)

更新：如果要逐元素乘法，請使用常規乘法功能。 在這個問題中可以看出這一點。

嘗試：

confidence_single_digit = tf.multiply(probs_L[:,1], probs_S1)

注意：我以前從未使用過TensorFlow。 這可能是尋找錯誤的起點。

Answer 3

這樣您能得到理想的結果嗎？

confidence_single_digit = tf.expand_dims(probs_L[:,1],1) * probs_S1

現在的形狀是這些。

<bound method Tensor.get_shape of <tf.Tensor 'ExpandDims_1:0' 
shape=(4096, 1) dtype=float32>>

<bound method Tensor.get_shape of <tf.Tensor 'strided_slice_2:0' 
shape=(4096, 9) dtype=float32>>

ValueError：尺寸必須相等，但對於'mul'來說必須為4096和9。為什么這里沒有廣播？

問題描述

3 個解決方案

解決方案1
1 已采納 2018-08-23 16:37:12

解決方案2
0 2018-08-23 09:52:51

解決方案3
0 2018-08-23 10:35:48

ValueError：尺寸必須相等，但對於&#39;mul&#39;來說必須為4096和9。 為什么這里沒有廣播？

問題描述

3 個解決方案

解決方案1 1 已采納 2018-08-23 16:37:12

解決方案2 0 2018-08-23 09:52:51

解決方案3 0 2018-08-23 10:35:48

ValueError：尺寸必須相等，但對於'mul'來說必須為4096和9。為什么這里沒有廣播？

解決方案1
1 已采納 2018-08-23 16:37:12

解決方案2
0 2018-08-23 09:52:51

解決方案3
0 2018-08-23 10:35:48