簡體   English   中英

Groupby還是以熊貓為中心?

[英]Groupby or pivot in pandas?

有人可以指導我匯總大熊貓中的數據嗎?

我有一個包含每個時間戳調查數據的龐大文件,該數據來自大約數千個不同人員和20多個不同位置。 每個調查都有四個級別的“原因”,我將它們列為Driver1和Driver2(共有4個級別)。 然后是一列,用於統計調查,而每個問題都有幾列。 由於原始數據的每一行都是單獨的調查,因此計數始終為1,得分可以為-1,0,1。

       Date        Location    Person  Driver1  Driver2  Surveys   Question1   
-----------------------------------------------------------------------------
 4/30/2014 21:41    a123b      xyz234   Quest    Ion       1         -1

我的目標是:

  • 通過匯總每日總調查(總和)和每個問題的平均分數來創建新的原始數據
  • 這應該是每個位置,每個人和每個駕駛員的每日(無時間戳)級別(4個級別)

      Date Location Person Driver1 Driver2 Surveys Question1 ----------------------------------------------------------------------------- 4/30/2014 a123b xyz234 Quest Ion 3 0.33 4/30/2014 a123b xyz234 Quest Bear 6 1 

這將大大減少文件大小,但仍能提供詳細的數據。 我想知道每個人每天對調查司機的表現,因此我可以跟蹤每月/每周的進度。

我認為它一定是這樣的:

df2 = df.groupby['Date','Location','Person','Driver1','Driver2','Driver3','Driver4']
df2['Surveys'].sum()
df2['Question1'].mean()

你近了 您需要在(groupby)周圍添加一些()

df2 = df.groupby(['Date','Location','Person','Driver1','Driver2','Driver3','Driver4'])

然后,如果需要,可以將下兩行合並為一

df2.agg({'Surveys' : 'sum', 'Question1' : 'mean'})

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM