繁体   English   中英

如何在python中没有pandas的情况下删除csv文件中的重复行?

[英]How to remove duplicated rows in a csv file without pandas in python?

解决方案中不允许使用pandas,只允许使用python标准库。 我有一个包含一列(左侧)的 csv 文件。 如何删除重复的行以使 csv 看起来与右侧完全一样? "25,60" 和 "60,25" 应该被视为一对重复的行。 对于每对重复的行,保留的行格式为“A,B”,其中 A < B,删除的行应该是 A>B。 在这种情况下,应保留“25,60”和“80,123”。 对于唯一行,它应该保持不变。 在此处输入图片说明

k = []
with open('file.csv','r') as dat, open('newfile.csv','w') as f:
    for i in dat:
      a = sorted(int(j) for j in i.split(','))
      if a not in k:
          k.append(a)
          f.write(','.join([str(m) for m in a]) +'\n')

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM