刪除僅在DataFrame列中出現一次的值

Question

我在列x有一個具有不同值的數據幀。 我想刪除在列中只出現一次的值。

所以這：

應該變成這樣：

我想知道是否有辦法做到這一點。

Answer 1

您可以使用groupby和transform輕松實現此目的：

In [1]: import pandas as pd

In [2]: df = pd.DataFrame([10, 30, 30, 40, 40, 50], columns=['x'])

In [3]: df = df[df.groupby('x').x.transform(len) > 1]

In [4]: df
Out[4]: 
    x
1  30
2  30
3  40
4  40

Answer 2

您可以使用groupby然后filter它：

In [9]:    
df = pd.DataFrame([10, 30, 30, 40, 40, 50], columns=['x'])
df = df.groupby('x').filter(lambda x: len(x) > 1)
df

Out[9]:
    x
1  30
2  30
3  40
4  40

Answer 3

如何更明確地保留所有重復值：

df = df.loc[df.duplicated(subset='x', keep=False), :]

相反，只保留唯一值：

df = df.loc[~df.duplicated(subset='x', keep=False), :]

和這個：

df = df.loc[~df.duplicated(subset='x'), :]

相當於：

df = df.drop_duplicates(subset='x')

刪除僅在DataFrame列中出現一次的值

問題描述

3 個解決方案

解決方案1
12 已采納 2015-10-11 23:41:49

解決方案2
2 2015-10-12 08:36:19

解決方案3
1 2017-03-22 17:33:39

刪除僅在DataFrame列中出現一次的值

問題描述

3 個解決方案

解決方案1 12 已采納 2015-10-11 23:41:49

解決方案2 2 2015-10-12 08:36:19

解決方案3 1 2017-03-22 17:33:39

解決方案1
12 已采納 2015-10-11 23:41:49

解決方案2
2 2015-10-12 08:36:19

解決方案3
1 2017-03-22 17:33:39