簡體   English   中英

熊貓從CSV和XLS比較並刪除數據

[英]Panda compare and remove data from csv and xls

我有2個文件(.csv和.xls)。 .csv只有一列(電子郵件)。 .xls有很多列。 我嘗試比較這兩個文件中的電子郵件列,並從不在.csv中的.xls郵件地址中刪除。 郵件地址未排序。

我已經寫了一些代碼,但沒有實現我的目標:

excel = pd.read_excel(file, skiprow=10, parse_cols = 'AL')
csv = pd.read_csv(namelist_file)
excel_keep = excel[excel.isin(csv)]
mask = excel.isin(csv.tolist())
excel[~mask]
print(excel_keep)

請問您有什么主意嗎? 問候。

df_csv = pd.read_csv(path_to_csv)
df_xlsx = pd.read_excel(path_to_excel)

## assuming column header for email in both files is 'email'
## if not change it by df = df.rename(columns={'oldName': 'email'})

df_xlsx = df_xlsx[df_xlsx['email'].isin(df_csv['email'])]

希望能有所幫助

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM