如何在 NumPy 數組中查找連續元素組

Question

我必須對 NumPy 數組中的連續元素進行聚類。 考慮以下示例

a = [ 0, 47, 48, 49, 50, 97, 98, 99]

輸出應該是一個元組列表，如下所示

[(0), (47, 48, 49, 50), (97, 98, 99)]

這里的差異只是元素之間的差異。 如果差異也可以指定為限制或硬編碼數字，那就太好了。

Answer 1

def consecutive(data, stepsize=1):
    return np.split(data, np.where(np.diff(data) != stepsize)[0]+1)

a = np.array([0, 47, 48, 49, 50, 97, 98, 99])
consecutive(a)

產量

[array([0]), array([47, 48, 49, 50]), array([97, 98, 99])]

Answer 2

這是一個小函數，可能會有所幫助：

def group_consecutives(vals, step=1):
    """Return list of consecutive lists of numbers from vals (number list)."""
    run = []
    result = [run]
    expect = None
    for v in vals:
        if (v == expect) or (expect is None):
            run.append(v)
        else:
            run = [v]
            result.append(run)
        expect = v + step
    return result

>>> group_consecutives(a)
[[0], [47, 48, 49, 50], [97, 98, 99]]
>>> group_consecutives(a, step=47)
[[0, 47], [48], [49], [50, 97], [98], [99]]

PS這是純Python。 對於 NumPy 解決方案，請參閱 unutbu 的答案。

Answer 3

(a[1:]-a[:-1])==1將產生一個布爾數組，其中False表示運行中斷。 您還可以使用內置的numpy.grad 。

Answer 4

這就是我到目前為止的想法：不確定是否 100% 正確

import numpy as np
a = np.array([ 0, 47, 48, 49, 50, 97, 98, 99])
print np.split(a, np.cumsum( np.where(a[1:] - a[:-1] > 1) )+1)

返回：

>>>[array([0]), array([47, 48, 49, 50]), array([97, 98, 99])]

Answer 5

測試一維數組

找到差異不是一個的地方

diffs = numpy.diff(array) != 1

獲取 diff 的索引，獲取第一個維度並添加一個，因為diff與前一個索引進行比較

indexes = numpy.nonzero(diffs)[0] + 1

用給定的索引拆分

groups = numpy.split(array, indexes)

Answer 6

這聽起來有點像家庭作業，所以如果你不介意我會建議一個方法

您可以使用遍歷列表

for i in range(len(a)):
    print a[i]

您可以測試列表中的下一個元素是否滿足以下條件

if a[i] == a[i] + 1:
    print "it must be a consecutive run"

您可以將結果單獨存儲在

results = []

當心 - 上面隱藏了一個索引超出范圍的錯誤，您需要處理

如何在 NumPy 數組中查找連續元素組

問題描述

6 個解決方案

解決方案1
212 2011-09-08 19:21:13

解決方案2
22 已采納 2011-09-08 18:56:31

解決方案3
12 2011-09-08 18:44:52

解決方案4
5 2011-09-08 19:14:42

解決方案5
0 2020-11-17 08:22:14

解決方案6
-2 2011-09-08 18:28:01

如何在 NumPy 數組中查找連續元素組

問題描述

6 個解決方案

解決方案1 212 2011-09-08 19:21:13

解決方案2 22 已采納 2011-09-08 18:56:31

解決方案3 12 2011-09-08 18:44:52

解決方案4 5 2011-09-08 19:14:42

解決方案5 0 2020-11-17 08:22:14

解決方案6 -2 2011-09-08 18:28:01

解決方案1
212 2011-09-08 19:21:13

解決方案2
22 已采納 2011-09-08 18:56:31

解決方案3
12 2011-09-08 18:44:52

解決方案4
5 2011-09-08 19:14:42

解決方案5
0 2020-11-17 08:22:14

解決方案6
-2 2011-09-08 18:28:01