Pandas：根据其中一列的值将多个新列连接到现有数据帧

Question

使用 Pandas，我手头有一个数据框：

	一个	乙
0	一个	9
1	b	9
2	c	9

遍历所有行（一个接一个），基于 A 列，我（从 ZipFile）加载（从 ZipFile）字典形式的附加列（其中一些缺失 - 需要消除整行）。 结果应该类似于：

	一个	乙	C	D
0	一个	9	阿富	一间酒吧
2	c	9	c-foo	c-bar

用于迭代的最佳方法是什么？ 尝试了几个选项，其中包括 for-in、apply、map，但它通常在打字问题上失败（我对此很陌生）。

任何帮助或指示将不胜感激。

Answer 1

假设您的数据如下所示：

import pandas as pd

data = {'A': {0: 'a', 1: 'b', 2: 'c'}, 
        'B': {0: 9, 1: 9, 2: 9}}

df = pd.DataFrame(data)

data2 = [{'A': 'a', 'C': 'a-foo', 'D': 'a-bar'},
         {'A': 'c', 'C': 'c-foo', 'D': 'c-bar'}]

df2 = pd.DataFrame(data2)

您可以将df.merge与df.dropna组合以合并两个dfs并删除在此过程中最终以NaN值结束的行（此处：仅索引为 1 的行）：

df.merge(df2, on='A', how='left').dropna(axis=0, how='any')

   A  B      C      D
0  a  9  a-foo  a-bar
2  c  9  c-foo  c-bar

Pandas：根据其中一列的值将多个新列连接到现有数据帧

问题描述

1 个解决方案

解决方案1
0 2022-09-06 20:49:56

Pandas：根据其中一列的值将多个新列连接到现有数据帧

问题描述

1 个解决方案

解决方案1 0 2022-09-06 20:49:56

解决方案1
0 2022-09-06 20:49:56