在給定列中刪除具有唯一元素的pandas dataFrame行。（獨特的意思是重復一次）

Question

假設我有以下dataFrame，我想刪除包含10和100的行，即在col1中只出現過一次的元素。

我可以執行以下操作：

a = df.groupby('col1').size()
b = list(a[a == 1].index)

然后有一個for循環並逐行刪除行：

d_ind = df[df['col1']==b[0]].index
df.drop(d_ind, axis=0, inplace=True)

有沒有更快，更有效的方法？

Answer 1

您可以在col1上使用duplicated方法，該方法可以使用keep=False參數檢測元素是否重復，並返回一個布爾系列，可用於子集/過濾/刪除行：

df[df.col1.duplicated(keep=False)]

#   col1  col2  months
#0     1     3       6
#1     1     4       6
#4     4    20       6
#5     4    11       7
#6     4    12       7

在給定列中刪除具有唯一元素的pandas dataFrame行。（獨特的意思是重復一次）

問題描述

1 個解決方案

解決方案1
2 已采納 2018-04-15 20:31:16

在給定列中刪除具有唯一元素的pandas dataFrame行。 （獨特的意思是重復一次）

問題描述

1 個解決方案

解決方案1 2 已采納 2018-04-15 20:31:16

在給定列中刪除具有唯一元素的pandas dataFrame行。（獨特的意思是重復一次）

解決方案1
2 已采納 2018-04-15 20:31:16