繁体   English   中英

Python:在多个数组列中计数零并有效地存储它们

[英]Python: Counting Zeros in multiple array columns and store them efficently

我创建一个数组:

import numpy as np
arr = [[0, 2, 3], [0, 1, 0], [0, 0, 1]]
arr = np.array(arr)

现在我计算每列的每个零并将其存储在一个变量中:

a = np.count_nonzero(arr[:,0]==0)
b = np.count_nonzero(arr[:,1]==0)
c = np.count_nonzero(arr[:,2]==0)

此代码工作正常。 但在我的情况下,我有更多的列,每个列都有超过 70000 个值。 这将是更多的代码行和 spyder 中一个非常混乱的变量探索器。

我的问题:

  1. 是否有可能使此代码更高效并仅将值保存在一种类型的数据中,例如字典、dataframe 或元组?
  2. 我可以使用循环来创建 dic、dataframe 或元组吗?

谢谢

您可以构造一个 boolean 数组arr == 0 ,然后沿行取其总和。

>>> (arr == 0).sum(0)
array([3, 1, 1])

使用 collections 模块中的有序字典:

from collections import OrderedDict
import numpy as np
from pprint import pprint as pp
import string

arr = np.array([[0, 2, 3], [0, 1, 0], [0, 0, 1]])
letters = string.ascii_letters
od = OrderedDict()

for i in range(len(arr)):
    od[letters[i]] = np.count_nonzero(arr[:, i]==0)

pp(od)

返回:

OrderedDict([('a', 3), ('b', 1), ('c', 1)])

示例用法:

print(f"First number of zeros: {od.get('a')}")

会给你:

First number of zeros: 3

要计算零,您可以沿每列计算非零并从每列的长度中减去结果:

arr.shape[0] - np.count_nonzero(arr, axis=0)

产生[3,1,1]

这个解决方案非常快,因为没有创建额外的大对象。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM