繁体   English   中英

使用 Python 3 进行数据清理

[英]Data cleaning using Python 3

我是 python 和数据分析的新手,我提取了一些数据并想清理它我有这个数据框:

姓名 | 评论 | 身份证 | 位置| 时间

但是位置colomn有不统一的价值观,例如有些人(英国),有些人(英国),部分(英国)作为自己的位置。

我想统一位置列,以便每个国家/地区都由一个名称标识,而不是该国家/地区有 3 个不同的名称,我想将它们全部替换为一个唯一的名称。

您可以创建一个字典,键是您可能会看到的所有可能的名称,而值是您想要转换的名称。

前任:

d = {'united kingdom': 'UK', 'United Kingdom': 'UK', 'uk': 'UK'}

然后

df['new_location'] = df['Location'].map(d)

您的 df 将有一个名为new_location的新列,这些键将转换为UK

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM