簡體   English   中英

來自CSV文件的輸出行基於某一列中的重復項(python)?

[英]Output lines from a CSV file based on duplicates in one of the columns (python)?

我一直在嘗試編寫一個腳本,該腳本將基於第一列中的重復值從CSV輸出行。

數據如下所示:

FULLNAME, ADDRESS_1, ADDRESS_2, CITY, STATE, ZIPCODE
JANE DOE, MAIN STREET 1, APT 1, METROPOLIS, NEW YORK, 10000

我正在使用的腳本如下所示:

import pandas as pd

df = pd.read_csv('FILE.csv', dtype=str)
names = df["FULLNAME"]
df[names.isin(names[names.duplicated()])].sort_values("FULLNAME")

print(df)

我遇到的問題是,不是打印了具有“ FULLNAME”重復值的行,而是打印了整個文件。

任何幫助將非常感激!

您的行有效,但您只是獲取值,而不是設置df。 因此,當您執行print(df)時,您只是在打印原始列表。

這會做你想要的

# assign duplicate entries to variable dupes
dupes = df[names.isin(names[names.duplicated()])].sort_values("FULLNAME")
print(dupes)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM