[英]Remove duplicates from DataFrame view
我有与此类似的代码:
df = raw_report[some_columns].copy()
df.drop_duplicates(inplace=True)
我使用copy()
来避免关于不确定性的警告。 但是,我想使用一个视图,因为稍后我仅从此DataFrame
读取。 生成警告的行是删除重复项的行,因此我认为它不会生成视图。
因此,我的问题是:有没有办法从视图中删除重复项? 或者,是否有一种方法可以细化视图,使其不包含重复项?
我认为您只需要通过DataFrame.drop_duplicates
某些列来放置重复项的参数子集:
raw_report.drop_duplicates(subset=[some_columns],inplace=True)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.