熊猫掉落部分重复

Question

I have 2 dfs: 我有2个DFS：

df1: df1：

    x  y  z
0   1  2  r
1   a  c  2
2  22  g  d

df2: df2：

    x  y  z
0   1  2  r
1   a  b  2
2   3  g  d

I want to drop when column y and z are duplicated. 当列y和z重复时，我想删除。

Desired result: 所需结果：

        x  y  z
    1   a  c  2

Because df1 and df2 both have same values in column y and z 因为df1和df2在y和z列中都具有相同的值

Answer 1

 cols=['y','z']#columns to check for having same value
 df1[~(df1[cols]==df2[cols]).all(axis=1)]#extracting the rows where x and y are `not equal(~)` in both dataframes

Answer 2

Using pd.merge you can do 使用pd.merge你可以做

In [266]: dff = df1.merge(df2, on=['y', 'z'], how='left',  indicator=True,
                          suffixes=['', 'right'])

In [267]: dff.loc[dff['_merge'].eq('left_only'), ['x', 'y', 'z']]
Out[267]:
   x  y  z
1  a  c  2

Answer 3

One solution could be 一种解决方案可能是

df1[df1.merge(df2, 'left', ['y', 'z']).x_y.isnull()]

Or, somewhat more low-key, 或者，有些低调，

df1[(df1[['y', 'z']] != df2[['y', 'z']]).any(1)]

Answer 4

Another way to achieve it is using loc 实现它的另一种方法是使用loc

pd.DataFrame(df1.loc[(df1.y != df2.y) | (df1.z != df2.z)])

Output 输出量

    x  y  z
1   a  c  2

熊猫掉落部分重复

问题描述

4 个解决方案

解决方案1
2 2018-08-05 14:12:37

解决方案2
1 已采纳 2018-08-05 13:02:41

解决方案3
1 2018-08-05 13:03:59

解决方案4
1 2018-08-05 13:27:26

熊猫掉落部分重复

问题描述

4 个解决方案

解决方案1 2 2018-08-05 14:12:37

解决方案2 1 已采纳 2018-08-05 13:02:41

解决方案3 1 2018-08-05 13:03:59

解决方案4 1 2018-08-05 13:27:26

解决方案1
2 2018-08-05 14:12:37

解决方案2
1 已采纳 2018-08-05 13:02:41

解决方案3
1 2018-08-05 13:03:59

解决方案4
1 2018-08-05 13:27:26