在Pandas中旋轉一個groupby對象？

Question

我有以下數據幀：

df = pd.DataFrame([
        [123, 'abc', '121'],
        [124, 'abc', '121'],
        [456, 'def', '121'],
        [123, 'abc', '122'],
        [123, 'abc', '122'],
        [456, 'def', '145'],
        [456, 'def', '145'],
        [456, 'def', '146'],
    ], columns=['userid', 'name', 'dt'])

我根據日期對它進行了分組： df2 = df.groupby('dt').apply(lambda df: df.reset_index(drop=True))

現在，數據框看起來像這樣：

現在，我想調整上面的內容，使它們采用以下格式：每個組的userid name_1, name_2, ..., name_k ，使得結束df看起來像這樣：

userid   name
123      abc
124      abc
456      def
123      abc, abc

Answer 1

您可以將cumcount與pivot_table cumcount使用，其中參數索引使用列userid和dt ，因此看起來不需要create df2 ：

df['cols'] = 'name_' + (df.groupby(['userid','dt']).cumcount() + 1).astype(str)

print (df.pivot_table(index=['userid', 'dt'],columns='cols', values='name', aggfunc=''.join))
cols       name_1 name_2
userid dt               
123    121    abc   None
       122    abc    abc
124    121    abc   None
456    121    def   None
       145    def    def
       146    def   None

Answer 2

查看groupby並apply 。 他們各自的文檔都在這里和這里。 您可以取消unstack （ docs ）創建的MultiIndex的額外級別。

df = df.set_index(['userid', 'dt'])['name']
df = df.groupby(level=[0,1]).apply(
    lambda st: pd.Series(st.values, index=['name_%i'%i for i in range(st.shape[0])])
).unstack(level=-1)
print(df)

輸出

           name_0 name_1
userid dt               
123    121    abc   None
       122    abc    abc
124    121    abc   None
456    121    def   None
       145    def    def
       146    def   None

在Pandas中旋轉一個groupby對象？

問題描述

2 個解決方案

解決方案1
2 已采納 2016-08-03 05:56:24

解決方案2
2 2016-08-03 06:15:12

在Pandas中旋轉一個groupby對象？

問題描述

2 個解決方案

解決方案1 2 已采納 2016-08-03 05:56:24

解決方案2 2 2016-08-03 06:15:12

解決方案1
2 已采納 2016-08-03 05:56:24

解決方案2
2 2016-08-03 06:15:12