[英]Does Numpy's vstack create a new array - a copy of the ones it combines?
我正在编写一些函数,这些函数沿着目录树向下,按名称对文件进行排序,并在表中对它们进行编码+更多信息。
这个表我定义为Numpy vstack数组。 在开始时,它向数组添加条目是快速的,但当它达到大约20 000个条目时,它会减慢很多。 这么多,为了达到目标大约9万个人口,它需要大约10分钟。
我非常怀疑vstack是罪魁祸首,因为它可能会复制整个表格+我追加的行。 官方的Numpy文档说vstacking只不过是“连接”......但这并没有回答我的问题。
因此,np.vstack()是否会查看要粘合在一起的数组的大小,然后将所需的内存和复制到我们正在堆叠的数组的内容中进行操作?
更新:女士们,先生们,对于统计数据,使用列表将执行时间提高到0.5秒。 这比实际速度提高了20多倍,实际上它甚至还低于此,因为我的测量包括一些额外的操作。
你是对的, np.vstack
复制完整的数组。
您可以通过小型python体验来确认它:
a = np.array([[1,2,3]])
b = np.array([[4,5,6]])
res = np.vstack((a,b))
res
array([[1, 2, 3],
[4, 5, 6]])
然后,如果修改数组a
并打印res,则可以看到res
未被修改
a[0,2] = 19
res
array([[1, 2, 3],
[4, 5, 6]])
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.