簡體   English   中英

僅當在另一列中所有記錄的值相同時,如何在具有重復項的熊貓DF中保留ID?

[英]How do I keep an ID in a pandas DF that has duplicates only if all of its records in another column have the same value?

如果所有考試成績都相同,我想保留研究編號,但如果不一樣,我就不能依賴數據的完整性,必須丟棄該編號。

我嘗試創建字典,但是對於下面的研究ID,只有L4被保存為值。

ResearchID  TestGrade   
1026379     L4  
1026379     L2
1026379     L4
1026379     L4  
1026379     L4  

您可以對研究ID進行分組 ,然后使用filter僅保留唯一測試成績的長度等於1的那些ID。

df.groupby('ResearchID').filter(lambda g: len(g.TestGrade.unique()) == 1)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM