繁体   English   中英

查找具有公共字段的两个csv文件之间的不常见行

[英]find uncommon rows between two csv files having common field

我有一个csv文件,包含以下数据

code
AAA
BBA
CCC

和另一个具有不同结构但共用栏的csv文件:

code
AAA
BBA
CCF

我想查找第二个数据框中不存在的第一个代码。 在这种情况下,CCC。

我怎样才能做到这一点?

由于您使用的是pandas标签,因此我假设您正在使用涉及pandas的解决方案。 如果您已经在两个不同的数据df_1读取了两个CSV文件,那么假设在df_1读取了第一个CSV,在df_1读取了第二个df_2 ,则可以执行以下操作:

>> df_1[~df_1['code'].isin(df_2['code'])][['code']]

要么

>> set(df_1['code'].values.tolist()) - set(df_2['code'].values.tolist())

要么

>> set(list(df_1['code'])) - set(list(df_2['code']))

我希望这有帮助!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM