簡體   English   中英

均值由數組的間隔,Python中的標准差(Pandas)

[英]Mean by interval of an array, standard deviation in python (Pandas)

我想計算兩個相關數組的許多連續間隔的平均值和標准偏差(下面的列表),其中前兩列分別是(假設)時間和距離。 第三,第四和第五是平均時間(中心),平均距離和偏差標准。 (實際上我是手工制作的)。 在示例中,您如何看到均值和標准差是針對每個連續三個時間間隔進行的(但通常可以超過4×4、10×10,依此類推)。

因此,我有類似的長列表,我想計算(也許使用PANDAS,NUMPY和/或SCIPY)這樣的循環,並創建它們的平均時間,平均距離和標准偏差數組。 因此,能夠繪制距離與時間的關系,並繪制時間和距離的平均值及其標准偏差(誤差,稱為sigma)

1  1   2  4.6   3.29
2  4   5  25.6  8.17
3  9   8  64.6  13.07
4  16  11 121.6 17.96
5  25  14 196.6 22.86
6  36  17 289.6 27.76
7  49  20 400.6 32.66
8  64
9  81
10 100
11 121
12 144
13 169
14 196
15 225
16 256
17 289
18 324
19 361
20 400
21 441

我使用errorbar繪制了這個,但是我的問題是如何在每個間隔內執行循環

在此處輸入圖片說明

您可以使用numpy做到這一點。 reshape可用於將數據分組為塊以計算統計信息:

import numpy as np

// data
time = np.arange(1.0,22.0)
distance = time ** 2

// group data into chunks to get stats
meanTime = np.mean(time.reshape(-1,3),axis=1)
meanDistance = np.mean(distance.reshape(-1,3), axis=1)
std = np.std(distance.reshape(-1,3), axis=1)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM