簡體   English   中英

python pandas groupby計算變化

[英]python pandas groupby calculate change

我想按組計算價值變化。

這是python pandas dataframe df我有:

Group |   Date      | Value
  A     01-02-2016     16 
  A     01-03-2016     15 
  A     01-04-2016     14 
  A     01-05-2016     17 
  A     01-06-2016     19 
  A     01-07-2016     20 
  B     01-02-2016     16 
  B     01-03-2016     13 
  B     01-04-2016     13 
  C     01-02-2016     16 
  C     01-03-2016     16 

我想計算一下,對於A組,值正在上升,對於B組他們正在下降而對於C組他們沒有變化。

我不確定如何處理它,因為在A組中,值最初會減少然后增加。 那么我應該看看平均變化或最近的變化?

我應該使用pct_change嗎? http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.pct_change.html我不知道如何指定時間幀。

df.groupby.pct_change

如果我能想象它也會很棒。 任何建議或提示非常感謝! 謝謝

groupby使用pct_change

d1 = df.set_index(['Date', 'Group']).Value
d2 = d1.groupby(level='Group').pct_change()
print(d2)

Date        Group
2016-01-02  A             NaN
2016-01-03  A       -0.062500
2016-01-04  A       -0.066667
2016-01-05  A        0.214286
2016-01-06  A        0.117647
2016-01-07  A        0.052632
2016-01-02  B             NaN
2016-01-03  B       -0.187500
2016-01-04  B        0.000000
2016-01-02  C             NaN
2016-01-03  C        0.000000
Name: Value, dtype: float64

可視化和比較的許多方法之一是看它們如何成長。 在這種情況下,我會

  • fillna(0)
  • add(1)
  • cumprod()

d2.fillna(0).add(1).cumprod().unstack().plot()

在此輸入圖像描述


建立

from io import StringIO
import pandas as pd

txt = """Group   Date       Value
  A     01-02-2016     16 
  A     01-03-2016     15 
  A     01-04-2016     14 
  A     01-05-2016     17 
  A     01-06-2016     19 
  A     01-07-2016     20 
  B     01-02-2016     16 
  B     01-03-2016     13 
  B     01-04-2016     13 
  C     01-02-2016     16 
  C     01-03-2016     16 """

df = pd.read_clipboard(parse_dates=[1])

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM