在TensorFlow中没有广播tf.matmul

Question

我有一个问题，我一直在努力。 它与tf.matmul()及其缺少广播有关。

我在https://github.com/tensorflow/tensorflow/issues/216上发现了类似的问题，但是tf.batch_matmul()看起来不像我的情况的解决方案。

我需要将输入数据编码为4D张量： X = tf.placeholder(tf.float32, shape=(None, None, None, 100))第一个维度是批量的大小，第二个维度是条目的数量在批次中。 您可以将每个条目想象为多个对象的组合（第三维）。 最后，每个对象由100个浮点值的向量描述。

请注意，我对第二维和第三维使用了None，因为实际大小可能会在每个批次中发生变化。 但是，为简单起见，让我们用实际数字来形成张量： X = tf.placeholder(tf.float32, shape=(5, 10, 4, 100))

这些是我计算的步骤：

计算100个浮点值的每个向量的函数（例如，线性函数） W = tf.Variable(tf.truncated_normal([100, 50], stddev=0.1)) Y = tf.matmul(X, W) 问题：否广播用于tf.matmul()并使用没有成功tf.batch_matmul()预期的Y形状：（5，10，4，50）
对批次的每个条目应用平均池（在每个条目的对象上）： Y_avg = tf.reduce_mean(Y, 2) Y_avg的预期形状：（5,10,50）

我预计tf.matmul()会支持广播。 然后我找到了tf.batch_matmul() ，但它看起来仍然不适用于我的情况（例如，W需要至少有3个维度，不清楚为什么）。

顺便说一句，上面我使用了一个简单的线性函数（其权重存储在W中）。 但在我的模型中，我有一个深层网络。 因此，我遇到的更普遍的问题是自动计算张量的每个切片的函数。 这就是为什么我预期tf.matmul()会有广播行为（如果是这样，可能甚至不需要tf.batch_matmul() ）。

期待向您学习！ 阿莱西奥

Answer 1

您可以通过将X重塑为shape [n, d]来实现这一点，其中d是计算的单个“实例”的维度（在您的示例中为100）， n是多维对象中这些实例的数量（ 5*10*4=200你的例子）。 重塑后，您可以使用tf.matmul ，然后重塑为所需的形状。 前三个维度可以变化的事实使得这一点很棘手，但您可以使用tf.shape来确定运行时的实际形状。 最后，您可以执行计算的第二步，该步骤应该是相应维度上的简单tf.reduce_mean 。 总而言之，它看起来像这样：

X = tf.placeholder(tf.float32, shape=(None, None, None, 100))
W = tf.Variable(tf.truncated_normal([100, 50], stddev=0.1))
X_ = tf.reshape(X, [-1, 100])
Y_ = tf.matmul(X_, W)
X_shape = tf.gather(tf.shape(X), [0,1,2]) # Extract the first three dimensions
target_shape = tf.concat(0, [X_shape, [50]])
Y = tf.reshape(Y_, target_shape)
Y_avg = tf.reduce_mean(Y, 2)

Answer 2

作为您链接建议的GitHub问题的重命名标题，您应该使用tf.tensordot() 。 它可以实现两个张量之间的轴对的收缩，符合Numpy的tensordot() 。 对于你的情况：

X = tf.placeholder(tf.float32, shape=(5, 10, 4, 100))
W = tf.Variable(tf.truncated_normal([100, 50], stddev=0.1))
Y = tf.tensordot(X, W, [[3], [0]])  # gives shape=[5, 10, 4, 50]

在TensorFlow中没有广播tf.matmul

问题描述

2 个解决方案

解决方案1
7 已采纳 2016-06-27 14:21:00

解决方案2
2 2018-10-17 10:19:14

在TensorFlow中没有广播tf.matmul

问题描述

2 个解决方案

解决方案1 7 已采纳 2016-06-27 14:21:00

解决方案2 2 2018-10-17 10:19:14

解决方案1
7 已采纳 2016-06-27 14:21:00

解决方案2
2 2018-10-17 10:19:14