[英]Pandas Pivot_Table grouped values
我在CSV( 數據集 )上有大量數據。 我想創建一個pd.pivot_table來按郵政編碼對數據進行匯總,但是,我的數據包含共享相同郵政編碼的行。
df = pd.read_csv('15zpallagi.csv')
df['A00100'] = df['A00100'].map('{:,.2f}'.format)
df.pivot_table(values='A00100', index='zipcode', aggfunc='sum')
當我運行上面的代碼以創建數據透視表時,值列包含多個值,就像它堆疊在具有多個值的總和上一樣。
df.pivot_table(values='A00100', index='zipcode',columns='agi_stub', aggfunc='sum')
如何創建僅添加列A00100並通過郵政編碼提供總計的數據透視表?
您可能會看到這些不一致之處,因為此行df['A00100'] = df['A00100'].map('{:,.2f}'.format)
將A00100列轉換為字符串類型,而不是浮點數。
注釋掉第二行,然后重試,看是否能解決問題。
如果您需要將數字格式化為僅顯示2個小數,請在所有轉換之后執行此操作。
如果由於其他原因(有效數字等)而四舍五入,請使用Dataframe.round函數而不是字符串格式。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.