为什么 tf.matmul 不能与转置张量一起使用？

Question

为什么tf.matmul用于转置张量？

transpose_b=True是可以的，但不是tf.transpose(inp) 。

此屏幕截图是在 Colab 中使用tensorflow-gpu==2.0.0-rc1制作的：

Answer 1

tf.linalg.matmul中的transpose_b=True仅转置第二个给定张量的最后两个轴，而tf.transpose没有更多的 arguments 完全反转维度。 相当于：

inp_t = tf.transpose(inp, (0, 2, 1))
tf.matmul(inp, inp_t)

Answer 2

如果您没有明确指定perm (permutation) 参数， tf.transpose()默认执行常规二维矩阵转置（它将 perm 参数设置为 input_tensor_rank-1）。 所以适当设置perm参数

inp_t = tf.transpose(inp, perm=[0,2,1])
y = tf.matmul(inp, x)
print(y)

Answer 3

Tensorflow 告诉您的是，将两个张量相乘时尺寸不匹配。 用基本的线性代数术语来考虑它。 矩阵相乘时，只能将矩阵相乘，其中第一个矩阵的最后一维与第二个矩阵的第一维相同。 例如，您可以将 2x4 矩阵与 4x2 矩阵相乘（这是transpose为您所做的。来自文档：

如果未给出perm ，则将其设置为 (n-1...0)，其中 n 是输入张量的秩。 因此，默认情况下，此操作对二维输入张量执行常规矩阵转置。

因此，如果您在更高维度上省略 perm， tf.transform()会像 2d 张量（矩阵）一样切换维度：

inp_t_without_perm = tf.transpose(inp)
inp_t_without_perm
# Output: <tf.Tensor 'transpose_8:0' shape=(1, 4, 2) dtype=float32>

所以它只是切换第一个维度的最后一个维度，而第二个维度保持不变。 这相当于：

inp_t_with_wrong_perm = tf.transpose(inp, perm=[2,1,0])
inp_t_with_wrong_perm
# Output: <tf.Tensor 'transpose_8:0' shape=(1, 4, 2) dtype=float32>

如果你这样做：

mul = tf.matmul(inp, inp_t_without_perm) # or with inp_t_with_wrong_perm

您收到此错误，因为您的前两个或后两个维度不匹配。

现在，当将高阶张量相乘时，您必须以与 2d 中相同的方式对齐不同的维度（将其视为将张量划分为矩阵和向量。在您的情况下，您有一个向量和一个矩阵...对不起，我还没想出更好的比喻，当我找到一个安静的半小时用笔和纸，我可以用爱因斯坦符号使它更正式，但这基本上是它的工作原理...）。

对于您的情况，有效的是：

inp = tf.reshape(tf.linspace(-1.0, 1.0, 8), (2,4,1))
# switch the last two dimensions so you can multiply 4x1 by 1x4
# and leave first dimension as it is.
inp_t = tf.transpose(inp, perm=[0,2,1])
mul = tf.matmul(inp, inp_t)
mul
# Output: <tf.Tensor 'MatMul_8:0' shape=(2, 4, 4) dtype=float32>

请注意，在您的情况下，这是唯一有效的排列，因为这种乘法是不可交换的。 所以你必须从左到右匹配尺寸（再次，抱歉挥手，但正式的数学证明需要我做一些高阶张量代数，但我认为这正是你想要实现的...）。 我没有 go 太深入到文档中，但我认为transform_b参数正在为你做这个排列。 希望有帮助。 请评论更多问题。

为什么 tf.matmul 不能与转置张量一起使用？

问题描述

3 个解决方案

解决方案1
1 已采纳 2019-09-19 15:08:57

解决方案2
1 2019-09-19 15:14:03

解决方案3
1 2019-09-19 15:42:15

为什么 tf.matmul 不能与转置张量一起使用？

问题描述

3 个解决方案

解决方案1 1 已采纳 2019-09-19 15:08:57

解决方案2 1 2019-09-19 15:14:03

解决方案3 1 2019-09-19 15:42:15

解决方案1
1 已采纳 2019-09-19 15:08:57

解决方案2
1 2019-09-19 15:14:03

解决方案3
1 2019-09-19 15:42:15