Groupby還是以熊貓為中心？

Question

有人可以指導我匯總大熊貓中的數據嗎？

我有一個包含每個時間戳調查數據的龐大文件，該數據來自大約數千個不同人員和20多個不同位置。 每個調查都有四個級別的“原因”，我將它們列為Driver1和Driver2（共有4個級別）。 然后是一列，用於統計調查，而每個問題都有幾列。 由於原始數據的每一行都是單獨的調查，因此計數始終為1，得分可以為-1,0,1。

       Date        Location    Person  Driver1  Driver2  Surveys   Question1   
-----------------------------------------------------------------------------
 4/30/2014 21:41    a123b      xyz234   Quest    Ion       1         -1

我的目標是：

通過匯總每日總調查（總和）和每個問題的平均分數來創建新的原始數據

這應該是每個位置，每個人和每個駕駛員的每日（無時間戳）級別（4個級別）

  Date Location Person Driver1 Driver2 Surveys Question1 ----------------------------------------------------------------------------- 4/30/2014 a123b xyz234 Quest Ion 3 0.33 4/30/2014 a123b xyz234 Quest Bear 6 1

這將大大減少文件大小，但仍能提供詳細的數據。 我想知道每個人每天對調查司機的表現，因此我可以跟蹤每月/每周的進度。

我認為它一定是這樣的：

df2 = df.groupby['Date','Location','Person','Driver1','Driver2','Driver3','Driver4']
df2['Surveys'].sum()
df2['Question1'].mean()

Answer 1

你近了 您需要在（groupby）周圍添加一些（）

df2 = df.groupby(['Date','Location','Person','Driver1','Driver2','Driver3','Driver4'])

然后，如果需要，可以將下兩行合並為一

df2.agg({'Surveys' : 'sum', 'Question1' : 'mean'})

Groupby還是以熊貓為中心？

問題描述

1 個解決方案

解決方案1
1 已采納 2014-10-23 01:42:56

Groupby還是以熊貓為中心？

問題描述

1 個解決方案

解決方案1 1 已采納 2014-10-23 01:42:56

解決方案1
1 已采納 2014-10-23 01:42:56