簡體   English   中英

從 CSV 轉換為 Python DataFrame 中的分類數據

[英]Convert to Categorical Data in Python DataFrame from a CSV

我有保險數據,其中有一個名為“區域”的列,其中指定了區域。 出於數據可視化的目的,我需要將這些字母值更改為數值,即 South 應該更改為 1。如果區域只有 1 或 2,我可以更改它,但由於區域計數較大,這是不可能的。 有什么方法可以做到這一點嗎? 以下是我到目前為止所做的代碼(不確定它是否正確)

k = insurance.shape[0]
dict1={}       
for i in range(k):
    if insurance['region'][i] in dict1:
        print('Testing')
    else:
        dict1[i] = insurance['region'][i]
print(dict1)

解決上述問題的代碼應該是什么?

如果您可以使用 3rd 方庫,則可以利用factorize docs之后,這里以玩具數據為例:

import pandas as pd

df = pd.DataFrame({"region": ["b", "c", "d" , "a", "a"]})

df["region_as_num"], _ = pd.factorize(df["region"], sort=True)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM