繁体   English   中英

带有多列的熊猫数据透视表

[英]pivot table in pandas with multiple columns

我在熊猫中有以下数据框

  date        prod    hourly_bucket      tank      trans      flag     
  01-01-2019  TP      05:00:00-06:00:00  2         Preset     Peak
  01-01-2019  TP      05:00:00-06:00:00  2         Preset     Peak
  01-01-2019  TP      05:00:00-06:00:00  2         Non Preset Peak
  02-01-2019  TP      05:00:00-06:00:00  2         Preset     Lean
  02-01-2019  TP      05:00:00-06:00:00  2         Preset     Lean
  02-01-2019  TP      05:00:00-06:00:00  2         Non Preset Lean

我需要的数据帧将是日级别和时段级别的聚合,然后计算Lean and Peak时段的Preset,Non-Preset交易次数

  date       tank   Lean_Non_Preset  Lean_Preset  Peak_Non_Preset  Peak_Preset
  01-01-2019 2      1                2            1                2

我正在熊猫后面

 lean_peak_preset_cnt = df.pivot_table(index=['date','tank'], columns=['flag'],values=['trans'],aggfunc='count').reset_index()  

但这没有给我所需的解决方案

'trans'添加到参数columns ,然后使用mapjoinMultiIndex中的MultiIndex

lean_peak_preset_cnt = df.pivot_table(index=['date','tank'], 
                                      columns=['flag','trans'],
                                      aggfunc='size', 
                                      fill_value=0) 

lean_peak_preset_cnt.columns = lean_peak_preset_cnt.columns.map('_'.join)
lean_peak_preset_cnt = lean_peak_preset_cnt.reset_index() 
print (lean_peak_preset_cnt)

         date  tank  Lean_No Preset  Lean_Preset  Peak_Non Preset  Peak_Preset
0  01-01-2019     2               0            0                1            2
1  02-01-2019     2               1            2                0            0

您几乎在那里:

piv = (df.pivot_table(index=['date', 'tank'], columns=['trans', 'flag'], 
                      aggfunc='size', fill_value=0))
piv.columns = piv.columns.ravel()

大小函数提供所需的计数,您希望将非计数值填充为0,并指定所需的列和索引。 有关更多详细信息,请参见文档 ravel将您的多索引列合并到一个级别。

                 (Nonpreset, Lean)  (Nonpreset, Peak)  (Preset, Lean)  \
#date       tank                                                         
#01-01-2019 2                     0                  1               0   
#02-01-2019 2                     1                  0               2   

                 (Preset, Peak)  
#date       tank                  
#01-01-2019 2                  2  
#02-01-2019 2                  0 

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM