[英]Data cleaning using Python 3
我是 python 和數據分析的新手,我提取了一些數據並想清理它我有這個數據框:
姓名 | 評論 | 身份證 | 位置| 時間
但是位置colomn有不統一的價值觀,例如有些人(英國),有些人(英國),部分(英國)作為自己的位置。
我想統一位置列,以便每個國家/地區都由一個名稱標識,而不是該國家/地區有 3 個不同的名稱,我想將它們全部替換為一個唯一的名稱。
您可以創建一個字典,鍵是您可能會看到的所有可能的名稱,而值是您想要轉換的名稱。
前任:
d = {'united kingdom': 'UK', 'United Kingdom': 'UK', 'uk': 'UK'}
然后
df['new_location'] = df['Location'].map(d)
您的 df 將有一個名為new_location
的新列,這些鍵將轉換為UK
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.