Pandas Dataframe：如何根據索引子集 drop_duplicates()？

Question

想知道是否有人可以幫助我：

有一個 pandas df 具有相當多的列（超過 50 個）。 我想根據子集（第 2 到 50 列）刪除重復項。

一直在嘗試使用 df.drop_duplicates(subset=["col1","col2",....])，但想知道是否有辦法傳遞列索引，所以我不必實際寫出所有要考慮刪除的列標題，但可以按照 df.drop_duplicates(subset = [2:]) 的方式做一些事情

預先感謝

Answer 1

您可以像這樣df.columns進行切片：

df.drop_duplicates(subset = df.columns[2:])

或者：

df.drop_duplicates(subset = df.columns[2:].tolist())