[英]Python: Pandas: Groupby & Pivot Tables are missing rows
我有一個數據框,該數據框由個人(其ID位於),活動和相應的分數組成。 我正在嘗試按學生和活動類型分組時獲得分數的總和。 我可以執行以下操作:
data_detail.pivot_table(["total_scored","total_scored_omitted"], index = ["id","activity"], aggfunc="sum")
data_detail.groupby(["id","activity"]).sum()
但是,當我通過查看典型學生來檢查結果時:
data_detail[data_detail["id"]== 41824840].sort_values("activity")
我看到有一些針對該給定學生的活動,這些活動在groupby / pivot表中丟失了。 如何確保最終的groupby / pivot表完整且不丟失任何值?
問題是分數的數據類型不一致(並且浮動!)。
其中一些是琴弦。 當我將所有樂譜轉換為浮點數后,出現了缺少的活動。
另一個好處是,數據類型統一,可以使計算更快!
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.