簡體   English   中英

如何使用Pandas處理CSV文件列中的數據?

[英]How to Manipulate Data in csv file columns using Pandas?

我的數據包含三列,其中一列是城市位置。 我想在.csv文件中添加新列,以在城市列中添加與城市對應的郵政編碼。 我不知道如何實現條件表達式來實現這一目標。 當前,我正在使用Pandas讀取csv文件,並且了解如何向csv文件中添加列,但是找不到有關如何以上述方式操作數據的任何信息。

編輯:

我的數據看起來像這樣(向下大約一百萬行)。 我有另一個具有兩列的csv文件,其中一列包含狀態和相應的郵政編碼。 我想將以下csv文件中的狀態與另一個csv文件中的郵政編碼匹配。 我的數據集還不包含那么多狀態,因此我想我可以利用一個簡單的條件表達式或case語句,如果該行中有某個特定狀態,則可以將新列設置為與某個郵政編碼對應。

在此處輸入圖片說明

我假設另一個csv文件具有“ STATE”和“ ZIPCODE”列,並且每個狀態僅包含一行,並且具有與大型csv文件相同的格式的狀態縮寫。

您要在狀態列上執行“合並”操作。 指定“左連接”樣式合並將確保保留原始數據集的每一行,即使您沒有相應的郵政編碼。

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.merge.html

https://pandas.pydata.org/pandas-docs/stable/merging.html

這應該可以滿足您的需求:

big_df = pandas.read_csv("big_file.csv")
zipcodes_df = pandas.read_csv("zipcodes.csv")
merged_df = big_df.merge(zipcode_df, on='STATE', how='left')
merged_df.to_csv("merged_big_file.csv", index=False)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM