numpy：为什么（x，1）和（x，）维度之间存在差异

Question

我想知道为什么在numpy中有维度的一维数组（长度，1）以及维度（长度）的一维数组w / o第二个值。

我经常遇到这种情况，例如当使用np.concatenate()需要预先reshape一个步骤（或者我可以直接使用hstack / vstack ）。

我想不出为什么这种行为是可取的。 谁能解释一下？

编辑：
其中一条评论建议我的问题可能是重复的。 我对Numpy的底层工作逻辑更感兴趣，而不是1d和2d数组之间存在区别，我认为这是所提到的线程的重点。

Answer 1

ndarray的数据存储为1d缓冲区 - 只是一块内存。 数组的多维特性由shape和strides属性以及使用它们的代码生成。

numpy开发人员选择允许任意数量的维度，因此形状和步幅表示为任何长度的元组，包括0和1。

相比之下，MATLAB是围绕为矩阵运算开发的FORTRAN程序构建的。 在早期，MATLAB中的所有东西都是2d矩阵。 在2000年左右（v3.5），它被推广到允许超过2d，但从不少。 numpy np.matrix仍然遵循旧的2d MATLAB约束。

如果您来自MATLAB世界，您将习惯这两个维度，以及行向量和列向量之间的区别。 但是在不受MATLAB影响的数学和物理学中，矢量是一维数组。 Python列表本质上是1d， c数组也是如此。 要获得2d，您必须具有列表或数组指针数组的列表，具有x[1][2]样式的索引。

看看这个数组及其变体的形状和步幅：

In [48]: x=np.arange(10)

In [49]: x.shape
Out[49]: (10,)

In [50]: x.strides
Out[50]: (4,)

In [51]: x1=x.reshape(10,1)

In [52]: x1.shape
Out[52]: (10, 1)

In [53]: x1.strides
Out[53]: (4, 4)

In [54]: x2=np.concatenate((x1,x1),axis=1)

In [55]: x2.shape
Out[55]: (10, 2)

In [56]: x2.strides
Out[56]: (8, 4)

MATLAB最后增加了新的尺寸。 它将其值order='F'为order='F'数组，并且可以很容易地将（n，1）矩阵更改为（n，1,1,1）。 numpy是默认order='C' ，并且可以在开始时轻松扩展数组维度。 在利用广播时，了解这一点至关重要。

因此x1 + x是a（10,1）+（10，）=>（10,1）+（1,10）=>（10,10）

由于广播， (n,)数组更像是(1,n)不是(n,1) 。 1d数组更像是行矩阵而不是第1列。

In [64]: np.matrix(x)
Out[64]: matrix([[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]])

In [65]: _.shape
Out[65]: (1, 10)

concatenate点是需要匹配的维度。 它不使用广播来调整尺寸。 有一堆stack函数可以简化这种约束，但它们通过在使用concatenate之前调整尺寸来实现。 看看他们的代码（可读的Python）。

因此，熟练的numpy用户需要熟悉该通用shape元组，包括empty () （0d数组）， (n,) 1d和up。 对于更高级的东西，了解步幅也有帮助（例如在转置的步幅和形状上查看）。

Answer 2

其中大部分是语法问题。 这个元组(x)根本不是元组（只是一个冗余）。 然而， (x,)是。

（x，）和（x，1）之间的差异更进一步。 你可以看看到像前面的问题的例子此。 引用它的例子，这是一个numpy数组：

>>> np.array([1, 2, 3]).shape
(3,)

但这个是2D：

>>> np.array([[1, 2, 3]]).shape
(1, 3)

重塑不会复制，除非它需要，所以它应该是安全的使用。

numpy：为什么（x，1）和（x，）维度之间存在差异

问题描述

2 个解决方案

解决方案1
9 已采纳 2016-07-15 18:59:24

解决方案2
2 2016-07-15 17:56:30

numpy：为什么（x，1）和（x，）维度之间存在差异

问题描述

2 个解决方案

解决方案1 9 已采纳 2016-07-15 18:59:24

解决方案2 2 2016-07-15 17:56:30

解决方案1
9 已采纳 2016-07-15 18:59:24

解决方案2
2 2016-07-15 17:56:30