[英]pandas pivot_table parameters
對於我們可以傳遞給 pivot_table 的所有參數,我不明白參數列和值的用途。 以下面的代碼為例,我被要求為 DataFrame 獎牌(過去 10 年各國獲得的奧運會獎牌)構建一個 pivot 表並按計數匯總。 希望我的問題有意義,並提前感謝。
medal_counts = pd.pivot_table(medals,index='Edition',values='Athlete',columns='NOC',aggfunc='count')
如果我的問題正確,您想知道pivot_table
的values
和columns
參數之間的區別。
你可以這樣想它們:
values
:您要聚合哪一列? 由於您正在應用計數,這意味着您要計數什么? 在您的示例中,您正在計算Athletes 。
columns
:您生成的 pivot 表應包含哪些列? 當您計算運動員時,您想通過什么方式計算他們? 在您的示例中,它將計算每個NOC的Athletes 。
我希望這能澄清它。 否則,您可以隨時查看pivot_table
的文檔。 它還有幾個示例可以幫助理解該功能。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.