[英]find uncommon rows between two csv files having common field
我有一个csv文件,包含以下数据
code
AAA
BBA
CCC
和另一个具有不同结构但共用栏的csv文件:
code
AAA
BBA
CCF
我想查找第二个数据框中不存在的第一个代码。 在这种情况下,CCC。
我怎样才能做到这一点?
由于您使用的是pandas
标签,因此我假设您正在使用涉及pandas
的解决方案。 如果您已经在两个不同的数据df_1
读取了两个CSV文件,那么假设在df_1
读取了第一个CSV,在df_1
读取了第二个df_2
,则可以执行以下操作:
>> df_1[~df_1['code'].isin(df_2['code'])][['code']]
要么
>> set(df_1['code'].values.tolist()) - set(df_2['code'].values.tolist())
要么
>> set(list(df_1['code'])) - set(list(df_2['code']))
我希望这有帮助!
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.