根据字典键向熊猫数据框添加一列

Question

我有以下数据框：

id  ip  
1   219.237.42.155
2   75.74.144.120
3   219.237.42.155

通过使用maxmindb-geolite2软件包，我可以找出特定ip分配给哪个城市。 如下代码：

from geolite2 import geolite2
reader = geolite2.reader()
reader.get('219.237.42.155')

将返回一个字典，然后通过查找键，我实际上可以获得一个城市名称：

reader.get('219.237.42.155')['city']['names']['en']

收益：

'Beijing'

我的问题是我不知道如何获取数据框中每个IP的城市并将其放在第三列中，因此结果将是：

id  ip              city
1   219.237.42.155  Beijing
2   75.74.144.120   Hollywood
3   219.237.42.155  Beijing

我得到的最远距离是通过使用代码将整个字典映射到单独的列：

df['city'] = df['ip'].apply(lambda x: reader.get(x))

另一方面：

df['city'] = df['ip'].apply(lambda x: reader.get(x)['city']['names']['en'])

抛出一个关键错误。我想念什么？

Answer 1

#you can use apply to check if the key exists before trying to access its values.
df.apply(lambda x: reader.get(x.ip,np.nan),axis=1).apply(lambda x: np.nan if pd.isnull(x) else x['city']['names']['en'])
Out[39]: 
0    Beijing
1        NaN
2    Beijing
dtype: object

根据字典键向熊猫数据框添加一列

问题描述

1 个解决方案

解决方案1
0 2017-05-25 23:23:32

根据字典键向熊猫数据框添加一列

问题描述

1 个解决方案

解决方案1 0 2017-05-25 23:23:32

解决方案1
0 2017-05-25 23:23:32