[英]Running a groupby on a pivot table with Pandas
我有一個數據透視表,如下所示:
In [41]: counts
Out[41]:
SourceColumnID 3029903181 3029903182 3029903183 3029903184 ResponseCount
ColID QuestionID RowID
3029903193 316923119 3029903189 773 788 778 803 3142
3029903194 316923119 3029903189 766 799 782 773 3120
[2 rows x 5 columns]
並且我試圖弄清楚如何對RowID進行分組,以便獲得每個RowID的每一列的總計數(在這種情況下,由於2在同一個rowid中,因此將它們全部相加)。
這是數據透視表索引:
In [42]: counts.index
Out[42]:
MultiIndex(levels=[[3029903193, 3029903194], [316923119], [3029903189]],
labels=[[0, 1], [0, 0], [0, 0]],
names=[u'ColID', u'QuestionID', u'RowID'])
您需要對'RowID'
進行分組。 由於它是MultiIndex上的級別,因此您可以將'RowID'
傳遞給level
關鍵字。
In [5]: df.groupby(level='RowID').sum()
Out[5]:
3029903181 3029903182 3029903183 3029903184 ResponseCount
RowID
3029903189 1539 1587 1560 1576 6262
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.