簡體   English   中英

pandas - 檢查dataframe groupby中的非唯一值

[英]pandas - check for non unique values in dataframe groupby

我有這個簡單的數據幀df

a,b
1,2
1,3
1,4
1,2
2,1
2,2
2,3
2,5
2,5

我想,以檢查是否有一式兩份b與在相對於每個組a 到目前為止,我做了以下事情:

g = df.groupby('a')['b'].unique()

返回:

a
1       [2, 3, 4]
2    [1, 2, 3, 5]

但我想有一個列表,每個組中的a ,與多次出現在b 在這種情況下的預期輸出將是:

a
1    [2]
2    [5]
g=df.groupby('a')['b'].value_counts()
g.where(g>1).dropna()

我們可以使用duplicated

print(df[df.duplicated()].drop_duplicates())

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM