如何获取 Python 时间序列中每一行的累积百分位值

Question

如何获得累积百分位值？

Dates
1990-01-02    17.24
1990-01-03    18.19
1990-01-04    19.22
1990-01-05    20.11
1990-01-08    20.26
1990-01-09    22.20
1990-01-10    22.44
1990-01-11    20.05
1990-01-12    24.64
1990-01-15    26.34
1990-01-16    24.18

2行数据中第2行的百分位数和3行数据中第3行的百分位数等等？

Answer 1

你可以这样做：

import pandas as pd
import numpy as np

df=pd.read_excel('filename.xlsx') #replace filename with name of your excel file

df['date']=pd.to_datetime(df['date']) #this doesn't affect your percentile calculation but you do it to leverage full power of pandas datetime functions

val_list=df.val.values
vals=[]
perc=[]

for r in range(len(val_list)):
    l=[x for x in val_list[0:r+1]]
    vals.append(l)

for value in vals:
    perc.append(np.percentile(value,50)) #change 50 to the percentile you want to calculate
df['percentile']=perc

print(df)

这里需要注意的几个关键点：

1) 我通过将您的数据导入为 pandas DF 来完成计算。 如果您想在 numpy 数组本身中执行此操作，则对上述代码进行一些调整即可。 但是，Pandas DF 是查看 Python 中表格数据的一种优雅方式。

2）这可能不是最有效的方法，但它可以完成工作。 因此，在非常大的数据集上小心使用它。

3）研究代码中提到的注释。

希望这可以帮助。 如果它没有在下面的评论中回复，我会尝试对其进行整理。

如何获取 Python 时间序列中每一行的累积百分位值

问题描述

1 个解决方案

解决方案1
1 2020-06-19 13:04:46

如何获取 Python 时间序列中每一行的累积百分位值

问题描述

1 个解决方案

解决方案1 1 2020-06-19 13:04:46

解决方案1
1 2020-06-19 13:04:46