[英]Applying python dictionary to column of a CSV file
我有一個 CSV 文件,其中包含一個對用戶不友好的列數據。 我需要將這些數據翻譯成有意義的東西。 簡單的查找/替換似乎很笨重,因為我要翻譯的可能組合有幾十個,如果不是幾百個的話。
例如:BLK = 黑色或 MNT TP = 山頂
可能有幾十個甚至幾百個翻譯——我在 CSV 表中已經有很多翻譯了。 問題是如何使用該字典來更改另一個 CSV 表中的值。 同樣重要的是要注意,這將(最終)需要每隔幾分鍾自行運行一次 - 而不僅僅是一次性翻譯。
如果您能更詳細地描述您正在處理的數據是什么,那就太好了。 不過我會盡力猜測。
假設您有一個 CSV 文件,您使用pandas
將其讀入名為df
的數據框和名為col
的“非用戶友好”列。 要替換col
中的所有值,首先,您需要一個包含所有鍵(原始文本)和值(新文本)的字典:
my_dict = {"BLK": "Black", "MNT TP": Mountain Top,...}
然后,將 map 字典列到:
df["col"] = df["col"].map(lambda x: my_dict.get(x, x))
如果某個鍵出現在字典中,則將其替換為字典中新的對應值,否則保持原值。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.