在 python dataframe 如果所有列的值都相同，如何基于 select 行？

Question

我有以下df格式：

Name  A1   A2  A3  A4
def   0    0   0   0
def1  0    1   0   0
def2  0    0   0   0
def3  1    0   0   0
def4  0    0   0   0

预期 output：

Name  A1   A2  A3  A4
def   0    0   0   0
def2  0    0   0   0
def4  0    0   0   0

Answer 1

如果Name是第一列，则使用DataFrame.iloc和DataFrame.all选择的所有列比较第一列：

df1 = df.iloc[:, 1:]
#if `Name` is any column
#df1 = df.drop('Name', axis=1)

df = df[df1.eq(df1.iloc[:, 0], axis=0).all(axis=1)]
print (df)
   Name  A1  A2  A3  A4
0   def   0   0   0   0
2  def2   0   0   0   0
4  def4   0   0   0   0

如果Name是索引：

print (df)
      A1  A2  A3  A4
Name                
def    0   0   0   0
def1   0   1   0   0
def2   0   0   0   0
def3   1   0   0   0
def4   0   0   0   0


df = df[df.eq(df.iloc[:, 0], axis=0).all(axis=1)]
print (df)
      A1  A2  A3  A4
Name                
def    0   0   0   0
def2   0   0   0   0
def4   0   0   0   0

如果性能不重要，因为在大型 DataFrame 中速度较慢，请使用DataFrame.nunique ：

df = df[df.nunique(axis=1).eq(1)]

Answer 2

使用pandas.DataFrame.nunique与axis=1 ：

df.set_index("Name").nunique(1).eq(1)

Output：

Name
def      True
def1    False
def2     True
def3    False
def4     True
dtype: bool

Answer 3

另一种方法是检查每列的方差：

df[df.var(axis=1) == 0]

Name  A1   A2  A3  A4
def   0    0   0   0
def2  0    0   0   0
def4  0    0   0   0

Answer 4

使用 dataframe 上的 drop 方法删除整行。

data.drop(["def1", "def3"], inplace = False)

第一个参数是索引列表。 如果为真，就地参数是更改原始 dataframe。

要了解更多信息，请访问： Dataframe

在 python dataframe 如果所有列的值都相同，如何基于 select 行？

问题描述

4 个解决方案

解决方案1
3 已采纳 2020-07-20 07:18:04

解决方案2
3 2020-07-20 07:20:26

解决方案3
1 2020-07-20 07:20:33

解决方案4
0 2020-07-20 08:09:05

在 python dataframe 如果所有列的值都相同，如何基于 select 行？

问题描述

4 个解决方案

解决方案1 3 已采纳 2020-07-20 07:18:04

解决方案2 3 2020-07-20 07:20:26

解决方案3 1 2020-07-20 07:20:33

解决方案4 0 2020-07-20 08:09:05

解决方案1
3 已采纳 2020-07-20 07:18:04

解决方案2
3 2020-07-20 07:20:26

解决方案3
1 2020-07-20 07:20:33

解决方案4
0 2020-07-20 08:09:05