繁体   English   中英

Pandas Pivot_Table分组值

[英]Pandas Pivot_Table grouped values

我在CSV( 数据集 )上有大量数据。 我想创建一个pd.pivot_table来按邮政编码对数据进行汇总,但是,我的数据包含共享相同邮政编码的行。

df = pd.read_csv('15zpallagi.csv')
df['A00100'] = df['A00100'].map('{:,.2f}'.format)
df.pivot_table(values='A00100', index='zipcode', aggfunc='sum')

当我运行上面的代码以创建数据透视表时,值列包含多个值,就像它堆叠在具有多个值的总和上一样。 枢纽分析表的输出

但是,如果运行以下代码,则将获得相同的值,但格式可以理解。 列透视的结果

df.pivot_table(values='A00100', index='zipcode',columns='agi_stub', aggfunc='sum')

如何创建仅添加列A00100并通过邮政编码提供总计的数据透视表?

您可能会看到这些不一致之处,因为此行df['A00100'] = df['A00100'].map('{:,.2f}'.format)将A00100列转换为字符串类型,而不是浮点数。

注释掉第二行,然后重试,看是否能解决问题。

如果您需要将数字格式化为仅显示2个小数,请在所有转换之后执行此操作。

如果由于其他原因(有效数字等)而四舍五入,请使用Dataframe.round函数而不是字符串格式。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM