按行過濾數據框

Question

嗨，我是Python初學者，我需要一些幫助。 我正在嘗試針對另一個過濾一個數據框。

DF1

 date          emp#   sku     transaction#   
 2017-01-01    10     200     399              
 2017-01-01    10     201     399             
 2017-01-01    10     202     399             
 2017-01-01    11     203     399             
 2017-01-01    11     200     399

DF2

 date          emp#   sku     transaction#
 2017-01-01    10     200     301
 2017-01-01    11     200     301

所需的Df1

 date          emp#   sku     transaction#
 2017-01-01    10     200     399
 2017-01-01    11     200     399

我知道這可以與內部聯接（一個emp＃和sku）一起使用，但是我會有錯誤的列，如何作為過濾器呢？

Answer 1

使用merge和on參數：

Df1.merge(Df2, on=['date','emp#','sku'], suffixes=('','_y'))\
   .drop('transaction#_y', axis=1)

輸出：

         date  emp#  sku  transaction#
0  2017-01-01    10  200           399
1  2017-01-01    11  200           399

Answer 2

這是沒有pd.merge一種方法。 這種方法的好處是您不必使用列名。

df2 = df2.set_index(['emp#', 'sku'])
df2['transaction#'] = df1.set_index(['emp#', 'sku'])['transaction#']
df2 = df2.reset_index()

#    emp#  sku        date  transaction#
# 0    10  200  2017-01-01           399
# 1    11  200  2017-01-01           399

Answer 3

您可以通過將所需的列轉換為字典（方向設置為list從df2進行過濾，然后使用isin檢查值是否存在。 最后，取每一行的min以確保同時滿足兩個條件，即

False + False = False
False + True = False
True + False = False
True + True = True

cols = ['emp#','sku']
df1[df1[cols].isin(df2[cols].to_dict(orient='list')).min(1)]

         date  emp#  sku  transaction#
0  2017-01-01    10  200           399
4  2017-01-01    11  200           399

Answer 4

您需要一個內部聯接，它看起來像：保留僅在兩個目錄中都存在的行：

df1.join(df2, how='inner')

按行過濾數據框

問題描述

4 個解決方案

解決方案1
2 2018-03-05 23:37:02

解決方案2
1 已采納 2018-03-06 00:37:00

解決方案3
0 2018-03-06 01:42:09

解決方案4
-1 2018-03-05 23:27:13

按行過濾數據框

問題描述

4 個解決方案

解決方案1 2 2018-03-05 23:37:02

解決方案2 1 已采納 2018-03-06 00:37:00

解決方案3 0 2018-03-06 01:42:09

解決方案4 -1 2018-03-05 23:27:13

解決方案1
2 2018-03-05 23:37:02

解決方案2
1 已采納 2018-03-06 00:37:00

解決方案3
0 2018-03-06 01:42:09

解決方案4
-1 2018-03-05 23:27:13