Python：检查值属于哪个bin

Question

我有一个值列表和bin边缘列表。 现在我需要检查它们属于哪个bin的所有值。 是否有更多的pythonic方式，而不是迭代值，然后遍历bin并检查值是否属于当前bin，如：

my_list = [3,2,56,4,32,4,7,88,4,3,4]
bins = [0,20,40,60,80,100]

for i in my_list:
    for j in range(len(bins)):
        if bins(j) < i < bins(j+1):
            DO SOMETHING

这对我来说看起来不太漂亮。 谢谢！

Answer 1

可能为时已晚，但为了将来的参考，numpy有一个功能就是这样：

http://docs.scipy.org/doc/numpy/reference/generated/numpy.digitize.html

>>> my_list = [3,2,56,4,32,4,7,88,4,3,4]
>>> bins = [0,20,40,60,80,100]
>>> np.digitize(my_list,bins)
array([1, 1, 3, 1, 2, 1, 1, 5, 1, 1, 1])

结果是一个索引数组，对应于来自bin的bin，来自my_list的每个元素也属于bin。 请注意，该函数还会将值放在第一个和最后一个bin边缘之外：

>>> my_list = [-5,200]
>>> np.digitize(my_list,bins)
array([0, 6])

而熊猫也有类似的东西：

http://pandas.pydata.org/pandas-docs/dev/basics.html#discretization-and-quantiling

>>> pd.cut(my_list, bins)
Categorical: 
array(['(0, 20]', '(0, 20]', '(40, 60]', '(0, 20]', '(20, 40]', '(0, 20]',
       '(0, 20]', '(80, 100]', '(0, 20]', '(0, 20]', '(0, 20]'], dtype=object)
Levels (5): Index(['(0, 20]', '(20, 40]', '(40, 60]', '(60, 80]',
                   '(80, 100]'], dtype=object)

Answer 2

也许这有助于您走上正轨：

>>> import itertools
>>> my_list = [3,2,56,4,32,4,7,88,4,3,4]
>>> for k, g in itertools.groupby(sorted(my_list), lambda x: x // 20 * 20):
...     print k, list(g)
... 
0 [2, 3, 3, 4, 4, 4, 4, 7]
20 [32]
40 [56]
80 [88]

Answer 3

首先，当值等于bin边界时，代码将失败 -

更改

if bins(j) < i < bins(j+1):

在某处有一个<=符号。

之后，使用bisect模块

import bisect
bisect.bisect(x, bins)

或bisect.bisect_right

取决于当值位于bin边界时是否更喜欢使用较高或较低的bin。

Python：检查值属于哪个bin

问题描述

3 个解决方案

解决方案1
23 已采纳 2013-06-02 11:36:46

解决方案2
3 2013-02-19 00:45:33

解决方案3
3 2013-02-19 00:46:35

Python：检查值属于哪个bin

问题描述

3 个解决方案

解决方案1 23 已采纳 2013-06-02 11:36:46

解决方案2 3 2013-02-19 00:45:33

解决方案3 3 2013-02-19 00:46:35

解决方案1
23 已采纳 2013-06-02 11:36:46

解决方案2
3 2013-02-19 00:45:33

解决方案3
3 2013-02-19 00:46:35