在 pandas DataFrame 中對相同的連續值進行分組

Question

我有以下 pandas dataframe：

我想將這些值存儲在另一個 dataframe 中，例如每組連續的相同值都會形成一個像這樣的標記組：

A 列表示組的值，B 表示出現次數。

這是我到目前為止所做的：

df = pd.DataFrame({'a':[0,0,1,2,2,2,3,2,2,1]})
df2 = pd.DataFrame()
for i,g in df.groupby([(df.a != df.a.shift()).cumsum()]):
    vc = g.a.value_counts()
    df2 = df2.append({'A':vc.index[0], 'B': vc.iloc[0]}, ignore_index=True).astype(int)

它有效，但有點混亂。

您是否想到了一種最短/更好的方法？

Answer 1

我會嘗試：

df['blocks'] = df['a'].ne(df['a'].shift()).cumsum()
(df.groupby(['a','blocks'],
           as_index=False,
           sort=False)
   .count()
   .drop('blocks', axis=1)
)

Output：

Answer 2

在 Pandas >0.25.0 中使用 GrouBy.agg GrouBy.agg

new_df= ( df.groupby(df['a'].ne(df['a'].shift()).cumsum(),as_index=False)
            .agg(A=('a','first'),B=('a','count')) )

print(new_df)

pandas <0.25.0

new_df= ( df.groupby(df['a'].ne(df['a'].shift()).cumsum(),as_index=False)
            .a
            .agg({'A':'first','B':'count'}) )

在 pandas DataFrame 中對相同的連續值進行分組

問題描述

2 個解決方案

解決方案1
1 2019-11-08 18:06:50

解決方案2
1 已采納 2019-11-08 18:11:25

在 pandas DataFrame 中對相同的連續值進行分組

問題描述

2 個解決方案

解決方案1 1 2019-11-08 18:06:50

解決方案2 1 已采納 2019-11-08 18:11:25

解決方案1
1 2019-11-08 18:06:50

解決方案2
1 已采納 2019-11-08 18:11:25