如何在python中将两列csv文件转换为字典

Question

我有以下 csv：

Name1    Name2

JSMITH    J Smith
ASMITH    A Smith

如何将其读入字典以便输出为

dict = {'JSMITH':'J Smith', 'ASMITH': 'A Smith'}

我用过了：

df= pd.read_csv('data.csv')

data_dict = df.to_dict(orient='list')

但它给了我

{'Name1': ['JSMITH','ASMITH'],'Name2': ['J Smith', 'A Smith']}

然后我希望在pandas的map功能中使用它，例如：

df2['Name'] = df2['Name'].replace(data_dict, regex=True)

任何帮助将非常感激！

Answer 1

如果您总是只有两列，请注意：

dict(df.itertuples(False,None))

或者使它成为pandas.Series并使用to_dict ：

df.set_index("Name1")["Name2"].to_dict()

输出：

{'ASMITH': 'A Smith', 'JSMITH': 'J Smith'}

请注意，如果您需要一个映射到pd.Series.replace的映射器，则Series与dict一样pd.Series.replace 。

s = df.set_index("Name1")["Name2"]
df["Name1"].replace(s, regex=True)

0    J Smith
1    A Smith
Name: Name1, dtype: object

这也意味着您可以删除to_dict并减少一些开销：

large_df = df.sample(n=100000, replace=True)

%timeit large_df.set_index("Name1")["Name2"]
# 4.76 ms ± 1.09 ms per loop (mean ± std. dev. of 7 runs, 100 loops each)

%timeit large_df.set_index("Name1")["Name2"].to_dict()
# 20.2 ms ± 976 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)

Answer 2

您可以使用zip和dict

dict(zip(df.Name1, df.Name2))

如何在python中将两列csv文件转换为字典

问题描述

2 个解决方案

解决方案1
2 已采纳 2020-09-21 05:01:15

解决方案2
0 2020-09-21 05:06:08

如何在python中将两列csv文件转换为字典

问题描述

2 个解决方案

解决方案1 2 已采纳 2020-09-21 05:01:15

解决方案2 0 2020-09-21 05:06:08

解决方案1
2 已采纳 2020-09-21 05:01:15

解决方案2
0 2020-09-21 05:06:08