[英]Data cleaning using Python 3
我是 python 和数据分析的新手,我提取了一些数据并想清理它我有这个数据框:
姓名 | 评论 | 身份证 | 位置| 时间
但是位置colomn有不统一的价值观,例如有些人(英国),有些人(英国),部分(英国)作为自己的位置。
我想统一位置列,以便每个国家/地区都由一个名称标识,而不是该国家/地区有 3 个不同的名称,我想将它们全部替换为一个唯一的名称。
您可以创建一个字典,键是您可能会看到的所有可能的名称,而值是您想要转换的名称。
前任:
d = {'united kingdom': 'UK', 'United Kingdom': 'UK', 'uk': 'UK'}
然后
df['new_location'] = df['Location'].map(d)
您的 df 将有一个名为new_location
的新列,这些键将转换为UK
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.