我在选定的列中有具有非唯一值的 pd.DataFrame。我怎样才能只留下具有所选列的唯一值的行？

Question

The example is in the picture.例子在图片中。 How could I drop rows with non-unique values in column 'signal'?如何删除“信号”列中具有非唯一值的行？

cols = ['signal', 'metabolite', 'adduct', 's_ind', 'm_ind', 'a_ind', 'distance']
data = [[0.500001, 1.000002, -0.5, 1, 1, 2, 0.000001], 
[0.500001, 0.000002, 0.5, 1, 2, 1, 0.000001], 
[0.500002, 1.000002, -0.5, 2, 1, 2, 0.000000], 
[0.500002, 0.000002, 0.5, 2, 2, 1, 0.000000], 
[0.500003, 1.000002, -0.5, 3, 1, 2, 0.000001], 
[0.500003, 0.000002, 0.5, 3, 2, 1, 0.000001], 
[1.000000, 1.000002, -0.5, 4, 1, 2, 0.499998], 
[1.000000, 0.000002, 0.5, 4, 2, 1, 0.499998], 
[0.000001, 1.000002, -0.5, 5, 1, 2, 0.500001], 
[0.000001, 0.000002, 0.5, 5, 2, 1, 0.500001]]

df = pd.DataFrame(data=data, columns=cols)
display(df)

Answer 1

Just call drop_duplicates and pass the column list to subset parameter, it will keep only the first non-`unique value (You can pass one or more columns from which you want to drop the non-unique values).只需调用drop_duplicates并将列列表传递给subset参数，它将只保留第一个非唯一值（您可以传递一个或多个要从中删除非唯一值的列）。

df.drop_duplicates(subset=['signal'])

     signal  metabolite  adduct  s_ind  m_ind  a_ind  distance
0  0.500001    1.000002    -0.5      1      1      2  0.000001
2  0.500002    1.000002    -0.5      2      1      2  0.000000
4  0.500003    1.000002    -0.5      3      1      2  0.000001
6  1.000000    1.000002    -0.5      4      1      2  0.499998
8  0.000001    1.000002    -0.5      5      1      2  0.500001

You can also pass keep as False if you don't want to include the non`-unique values at all.如果您根本不想包含非唯一值，也可以将keep作为False传递。

Answer 2

You're looking for pd.drop_duplicates() .您正在寻找pd.drop_duplicates() 。 See here :见这里：

df = df.drop_duplicates("signal")

我在选定的列中有具有非唯一值的 pd.DataFrame。我怎样才能只留下具有所选列的唯一值的行？

问题描述

2 个解决方案

解决方案1
2 2021-06-16 14:56:10

解决方案2
1 2021-06-16 14:56:17

我在选定的列中有具有非唯一值的 pd.DataFrame。 我怎样才能只留下具有所选列的唯一值的行？

问题描述

2 个解决方案

解决方案1 2 2021-06-16 14:56:10

解决方案2 1 2021-06-16 14:56:17

我在选定的列中有具有非唯一值的 pd.DataFrame。我怎样才能只留下具有所选列的唯一值的行？

解决方案1
2 2021-06-16 14:56:10

解决方案2
1 2021-06-16 14:56:17