數組欠采樣Python

Question

我有許多不同長度的數組，而我想為這些數組設置一個固定長度，比如說100個樣本。 這些數組包含時間序列，在減小數組大小的同時，我不想失去這些序列的形狀。 我想我在這里需要的是欠采樣算法。 是否有一種簡單的方法來減少數組中的樣本數量，使其中一些值像平均值一樣？

謝謝

Answer 1

如果您使用具有生成的隨機索引的切片，並且保留原始數組（或僅保留其形狀以減少內存使用）：

import numpy as np
input_data = somearray
shape = input_data.shape
n_samples= 100
inds = np.random.randint(0,shape[0], size=n_samples)
sub_samples = input_data[inds]

Answer 2

這是一個沒有numpy的小腳本。 即使所需的長度大於數組的長度，也可以保持形狀。

from math import floor

def sample(input, count):
    output = []
    sample_size = float(len(input)) / count
    for i in range(count):
        output.append(input[int(floor(i * sample_size))])
    return output

Answer 3

這是尼克·弗林漢姆（Nick Fellingham）回答的簡短版本。

from math import floor
def sample(input,count):
    ss=float(len(input))/count
    return [ input[int(floor(i*ss))] for i in range(count) ]

數組欠采樣Python

問題描述

3 個解決方案

解決方案1
2 2015-02-20 16:42:20

解決方案2
1 已采納 2015-02-20 16:55:16

解決方案3
1 2015-02-20 17:09:27

數組欠采樣Python

問題描述

3 個解決方案

解決方案1 2 2015-02-20 16:42:20

解決方案2 1 已采納 2015-02-20 16:55:16

解決方案3 1 2015-02-20 17:09:27

解決方案1
2 2015-02-20 16:42:20

解決方案2
1 已采納 2015-02-20 16:55:16

解決方案3
1 2015-02-20 17:09:27