將 python 字典應用於 CSV 文件的列

Question

我有一個 CSV 文件，其中包含一個對用戶不友好的列數據。 我需要將這些數據翻譯成有意義的東西。 簡單的查找/替換似乎很笨重，因為我要翻譯的可能組合有幾十個，如果不是幾百個的話。

例如：BLK = 黑色或 MNT TP = 山頂

可能有幾十個甚至幾百個翻譯——我在 CSV 表中已經有很多翻譯了。 問題是如何使用該字典來更改另一個 CSV 表中的值。 同樣重要的是要注意，這將（最終）需要每隔幾分鍾自行運行一次 - 而不僅僅是一次性翻譯。

Answer 1

如果您能更詳細地描述您正在處理的數據是什么，那就太好了。 不過我會盡力猜測。

假設您有一個 CSV 文件，您使用pandas將其讀入名為df的數據框和名為col的“非用戶友好”列。 要替換col中的所有值，首先，您需要一個包含所有鍵（原始文本）和值（新文本）的字典：

my_dict = {"BLK": "Black", "MNT TP": Mountain Top,...}

然后，將 map 字典列到：

df["col"] = df["col"].map(lambda x: my_dict.get(x, x))

如果某個鍵出現在字典中，則將其替換為字典中新的對應值，否則保持原值。