來自CSV文件的輸出行基於某一列中的重復項（python）？

Question

我一直在嘗試編寫一個腳本，該腳本將基於第一列中的重復值從CSV輸出行。

數據如下所示：

FULLNAME, ADDRESS_1, ADDRESS_2, CITY, STATE, ZIPCODE
JANE DOE, MAIN STREET 1, APT 1, METROPOLIS, NEW YORK, 10000

我正在使用的腳本如下所示：

import pandas as pd

df = pd.read_csv('FILE.csv', dtype=str)
names = df["FULLNAME"]
df[names.isin(names[names.duplicated()])].sort_values("FULLNAME")

print(df)

我遇到的問題是，不是打印了具有“ FULLNAME”重復值的行，而是打印了整個文件。

任何幫助將非常感激！

Answer 1

您的行有效，但您只是獲取值，而不是設置df。 因此，當您執行print（df）時，您只是在打印原始列表。

這會做你想要的

# assign duplicate entries to variable dupes
dupes = df[names.isin(names[names.duplicated()])].sort_values("FULLNAME")
print(dupes)

來自CSV文件的輸出行基於某一列中的重復項（python）？

問題描述

1 個解決方案

解決方案1
0 2017-11-20 22:50:51

來自CSV文件的輸出行基於某一列中的重復項（python）？

問題描述

1 個解決方案

解決方案1 0 2017-11-20 22:50:51

解決方案1
0 2017-11-20 22:50:51