簡體   English   中英

使用 Python 3 進行數據清理

[英]Data cleaning using Python 3

我是 python 和數據分析的新手,我提取了一些數據並想清理它我有這個數據框:

姓名 | 評論 | 身份證 | 位置| 時間

但是位置colomn有不統一的價值觀,例如有些人(英國),有些人(英國),部分(英國)作為自己的位置。

我想統一位置列,以便每個國家/地區都由一個名稱標識,而不是該國家/地區有 3 個不同的名稱,我想將它們全部替換為一個唯一的名稱。

您可以創建一個字典,鍵是您可能會看到的所有可能的名稱,而值是您想要轉換的名稱。

前任:

d = {'united kingdom': 'UK', 'United Kingdom': 'UK', 'uk': 'UK'}

然后

df['new_location'] = df['Location'].map(d)

您的 df 將有一個名為new_location的新列,這些鍵將轉換為UK

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM