![](/img/trans.png)
[英]subtracting 4 columns of one csv file to another csv file and want output in Text file -Python
[英]Output lines from a CSV file based on duplicates in one of the columns (python)?
我一直在嘗試編寫一個腳本,該腳本將基於第一列中的重復值從CSV輸出行。
數據如下所示:
FULLNAME, ADDRESS_1, ADDRESS_2, CITY, STATE, ZIPCODE
JANE DOE, MAIN STREET 1, APT 1, METROPOLIS, NEW YORK, 10000
我正在使用的腳本如下所示:
import pandas as pd
df = pd.read_csv('FILE.csv', dtype=str)
names = df["FULLNAME"]
df[names.isin(names[names.duplicated()])].sort_values("FULLNAME")
print(df)
我遇到的問題是,不是打印了具有“ FULLNAME”重復值的行,而是打印了整個文件。
任何幫助將非常感激!
您的行有效,但您只是獲取值,而不是設置df。 因此,當您執行print(df)時,您只是在打印原始列表。
這會做你想要的
# assign duplicate entries to variable dupes
dupes = df[names.isin(names[names.duplicated()])].sort_values("FULLNAME")
print(dupes)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.