簡體   English   中英

Pandas Dataframe:如何根據索引子集 drop_duplicates()?

[英]Pandas Dataframe: How to drop_duplicates() based on index subset?

想知道是否有人可以幫助我:

有一個 pandas df 具有相當多的列(超過 50 個)。 我想根據子集(第 2 到 50 列)刪除重復項。

一直在嘗試使用 df.drop_duplicates(subset=["col1","col2",....]),但想知道是否有辦法傳遞列索引,所以我不必實際寫出所有要考慮刪除的列標題,但可以按照 df.drop_duplicates(subset = [2:]) 的方式做一些事情

預先感謝

您可以像這樣df.columns進行切片:

df.drop_duplicates(subset = df.columns[2:])

或者:

df.drop_duplicates(subset = df.columns[2:].tolist())

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM