根据索引合并数据框

Question

如何合并2个数据帧df1和df2 ，以获得具有相同索引（且列中具有相同值）的df1和df2行的df3 ？

df1 = pd.DataFrame({'A': ['A0', 'A2', 'A3', 'A7'],
                        'B': ['B0', 'B2', 'B3', 'B7'],
                        'C': ['C0', 'C2', 'C3', 'C7'],
                        'D': ['D0', 'D2', 'D3', 'D7']},
                         index=[0, 2, 3,7])

测试1

df2 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A7'],
                    'B': ['B0', 'B1', 'B2', 'B7'],
                    'C': ['C0', 'C1', 'C2', 'C7'],
                    'D': ['D0', 'D1', 'D2', 'D7']},
                     index=[0, 1, 2, 7])

测试2

df2 = pd.DataFrame({'A': ['A1'],
                    'B': ['B1'],
                    'C': ['C1'],
                    'D': ['D1']},
                     index=[1])

预期输出测试1

Out[13]: 
    A   B   C   D
0  A0  B0  C0  D0
2  A2  B2  C2  D2
7  A7  B7  C7  D7

预期输出测试2

Empty DataFrame
Columns: [A, B, C, D]
Index: []

Answer 1

只是merge ：

In[111]:
df1.merge(df2)

Out[111]: 
    A   B   C   D
0  A0  B0  C0  D0

merge的默认参数是合并所有列，执行inner合并，以便仅在所有值一致的情况下

查看索引匹配要求，我将在合并之前过滤df：

In[131]:
filtered = df1.loc[df2.index].dropna()
filtered

Out[131]: 
    A   B   C   D
1  A1  B1  C1  D1

然后合并

In[132]:
filtered.merge(df2)
Out[132]: 
    A   B   C   D
0  A0  B0  C0  D0

如果索引根本不匹配，则说df2的第一行是1而不是2 ：

In[133]:
filtered = df1.loc[df2.index].dropna()
filtered
Out[133]: 
    A   B   C   D
1  A1  B1  C1  D1

然后merge将返回一个空df，因为索引行的值不同：

In[134]:
filtered.merge(df2)

Out[132]: 
Empty DataFrame
Columns: [A, B, C, D]
Index: []

UPDATE

在您的新数据集上， merge将重置索引，这是默认行为：

In[152]:
filtered.merge(df2)

Out[152]: 
    A   B   C   D
0  A0  B0  C0  D0
1  A2  B2  C2  D2
2  A7  B7  C7  D7

因此，要保留索引，我们可以使用相等运算符制作一个布尔掩码，并调用dropna以便dropna任何出现NaN值的行，这些行将在值不一致的地方出现，这将处理所有情况：

In[153]:
filtered[filtered== df2.loc[filtered.index]].dropna()

Out[153]: 
    A   B   C   D
0  A0  B0  C0  D0
2  A2  B2  C2  D2
7  A7  B7  C7  D7

Answer 2

如果确定值相同，则可以执行以下操作：

df1.loc[df1.index.to_series().isin(df2.index)]

无需进行合并。

根据索引合并数据框

问题描述

测试1

测试2

预期输出测试1

预期输出测试2

2 个解决方案

解决方案1
2 2017-08-24 08:50:41

解决方案2
1 2017-08-24 08:51:32

根据索引合并数据框

问题描述

测试1

测试2

预期输出测试1

预期输出测试2

2 个解决方案

解决方案1 2 2017-08-24 08:50:41

解决方案2 1 2017-08-24 08:51:32

解决方案1
2 2017-08-24 08:50:41

解决方案2
1 2017-08-24 08:51:32