[英]Mean by interval of an array, standard deviation in python (Pandas)
我想計算兩個相關數組的許多連續間隔的平均值和標准偏差(下面的列表),其中前兩列分別是(假設)時間和距離。 第三,第四和第五是平均時間(中心),平均距離和偏差標准。 (實際上我是手工制作的)。 在示例中,您如何看到均值和標准差是針對每個連續三個時間間隔進行的(但通常可以超過4×4、10×10,依此類推)。
因此,我有類似的長列表,我想計算(也許使用PANDAS,NUMPY和/或SCIPY)這樣的循環,並創建它們的平均時間,平均距離和標准偏差數組。 因此,能夠繪制距離與時間的關系,並繪制時間和距離的平均值及其標准偏差(誤差,稱為sigma)
1 1 2 4.6 3.29
2 4 5 25.6 8.17
3 9 8 64.6 13.07
4 16 11 121.6 17.96
5 25 14 196.6 22.86
6 36 17 289.6 27.76
7 49 20 400.6 32.66
8 64
9 81
10 100
11 121
12 144
13 169
14 196
15 225
16 256
17 289
18 324
19 361
20 400
21 441
我使用errorbar
繪制了這個,但是我的問題是如何在每個間隔內執行循環
您可以使用numpy做到這一點。 reshape
可用於將數據分組為塊以計算統計信息:
import numpy as np
// data
time = np.arange(1.0,22.0)
distance = time ** 2
// group data into chunks to get stats
meanTime = np.mean(time.reshape(-1,3),axis=1)
meanDistance = np.mean(distance.reshape(-1,3), axis=1)
std = np.std(distance.reshape(-1,3), axis=1)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.