[英]numpy: Why is there a difference between (x,1) and (x, ) dimensionality
我想知道为什么在numpy中有维度的一维数组(长度,1)以及维度(长度)的一维数组w / o第二个值。
我经常遇到这种情况,例如当使用np.concatenate()
需要预先reshape
一个步骤(或者我可以直接使用hstack
/ vstack
)。
我想不出为什么这种行为是可取的。 谁能解释一下?
编辑:
其中一条评论建议我的问题可能是重复的。 我对Numpy的底层工作逻辑更感兴趣,而不是1d和2d数组之间存在区别,我认为这是所提到的线程的重点。
ndarray
的数据存储为1d缓冲区 - 只是一块内存。 数组的多维特性由shape
和strides
属性以及使用它们的代码生成。
numpy
开发人员选择允许任意数量的维度,因此形状和步幅表示为任何长度的元组,包括0和1。
相比之下,MATLAB是围绕为矩阵运算开发的FORTRAN程序构建的。 在早期,MATLAB中的所有东西都是2d矩阵。 在2000年左右(v3.5),它被推广到允许超过2d,但从不少。 numpy
np.matrix
仍然遵循旧的2d MATLAB约束。
如果您来自MATLAB世界,您将习惯这两个维度,以及行向量和列向量之间的区别。 但是在不受MATLAB影响的数学和物理学中,矢量是一维数组。 Python列表本质上是1d, c
数组也是如此。 要获得2d,您必须具有列表或数组指针数组的列表,具有x[1][2]
样式的索引。
看看这个数组及其变体的形状和步幅:
In [48]: x=np.arange(10)
In [49]: x.shape
Out[49]: (10,)
In [50]: x.strides
Out[50]: (4,)
In [51]: x1=x.reshape(10,1)
In [52]: x1.shape
Out[52]: (10, 1)
In [53]: x1.strides
Out[53]: (4, 4)
In [54]: x2=np.concatenate((x1,x1),axis=1)
In [55]: x2.shape
Out[55]: (10, 2)
In [56]: x2.strides
Out[56]: (8, 4)
MATLAB最后增加了新的尺寸。 它将其值order='F'
为order='F'
数组,并且可以很容易地将(n,1)矩阵更改为(n,1,1,1)。 numpy
是默认order='C'
,并且可以在开始时轻松扩展数组维度。 在利用广播时,了解这一点至关重要。
因此x1 + x
是a(10,1)+(10,)=>(10,1)+(1,10)=>(10,10)
由于广播, (n,)
数组更像是(1,n)
不是(n,1)
。 1d数组更像是行矩阵而不是第1列。
In [64]: np.matrix(x)
Out[64]: matrix([[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]])
In [65]: _.shape
Out[65]: (1, 10)
concatenate
点是需要匹配的维度。 它不使用广播来调整尺寸。 有一堆stack
函数可以简化这种约束,但它们通过在使用concatenate
之前调整尺寸来实现。 看看他们的代码(可读的Python)。
因此,熟练的numpy用户需要熟悉该通用shape
元组,包括empty ()
(0d数组), (n,)
1d和up。 对于更高级的东西,了解步幅也有帮助(例如在转置的步幅和形状上查看)。
其中大部分是语法问题。 这个元组(x)
根本不是元组(只是一个冗余)。 然而, (x,)
是。
(x,)和(x,1)之间的差异更进一步。 你可以看看到像前面的问题的例子此 。 引用它的例子,这是一个numpy数组:
>>> np.array([1, 2, 3]).shape
(3,)
但这个是2D:
>>> np.array([[1, 2, 3]]).shape
(1, 3)
重塑不会复制,除非它需要,所以它应该是安全的使用。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.