簡體   English   中英

Python:熊貓:Groupby和數據透視表缺少行

[英]Python: Pandas: Groupby & Pivot Tables are missing rows

我有一個數據框,該數據框由個人(其ID位於),活動和相應的分數組成。 我正在嘗試按學生和活動類型分組時獲得分數的總和。 我可以執行以下操作:

data_detail.pivot_table(["total_scored","total_scored_omitted"], index = ["id","activity"], aggfunc="sum")

data_detail.groupby(["id","activity"]).sum()

但是,當我通過查看典型學生來檢查結果時:

data_detail[data_detail["id"]== 41824840].sort_values("activity")

我看到有一些針對該給定學生的活動,這些活動在groupby / pivot表中丟失了。 如何確保最終的groupby / pivot表完整且不丟失任何值?

問題是分數數據類型不一致(並且浮動!)。

其中一些是琴弦。 當我將所有樂譜轉換為浮點數后,出現了缺少的活動。

另一個好處是,數據類型統一,可以使計算更快!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM