[英]Adding Column in Pandas Dataframe Based on column with dictionary values
[英]adding a column to a pandas dataframe, based on dictionary key
我有以下数据框:
id ip
1 219.237.42.155
2 75.74.144.120
3 219.237.42.155
通过使用maxmindb-geolite2软件包,我可以找出特定ip分配给哪个城市。 如下代码:
from geolite2 import geolite2
reader = geolite2.reader()
reader.get('219.237.42.155')
将返回一个字典,然后通过查找键,我实际上可以获得一个城市名称:
reader.get('219.237.42.155')['city']['names']['en']
收益:
'Beijing'
我的问题是我不知道如何获取数据框中每个IP的城市并将其放在第三列中,因此结果将是:
id ip city
1 219.237.42.155 Beijing
2 75.74.144.120 Hollywood
3 219.237.42.155 Beijing
我得到的最远距离是通过使用代码将整个字典映射到单独的列:
df['city'] = df['ip'].apply(lambda x: reader.get(x))
另一方面:
df['city'] = df['ip'].apply(lambda x: reader.get(x)['city']['names']['en'])
抛出一个关键错误。我想念什么?
#you can use apply to check if the key exists before trying to access its values.
df.apply(lambda x: reader.get(x.ip,np.nan),axis=1).apply(lambda x: np.nan if pd.isnull(x) else x['city']['names']['en'])
Out[39]:
0 Beijing
1 NaN
2 Beijing
dtype: object
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.