[英]Compare two dataframe columns in python
我想比较两个 dataframe 列和它们的值。 如果匹配则为 1,如果不匹配则为 0。
我怎样才能做到这一点。? dataframe 具有所有相同的列名。 我需要检查这些值是否匹配。
我假设您使用的是 pandas。 在您的特定情况下,您可以这样做:
#Setup
df1 = pd.DataFrame({'col' : [5,4,2,6,1,7]})
df2 = pd.DataFrame({'col' : [3,4,0,6,1,5]})
#Relevant code
(df1["col"] == df2["col"]).astype("int8")
Output
0 0
1 1
2 0
3 1
4 1
5 0
Name: col, dtype: int8
让我们将df1
和df2
视为目标数据框,将col
视为感兴趣的列。
import pandas as pd
def match_columns(df1, df2, col):
match_list = []
data1_list = df1[col].tolist()
data2_list = df2[col].tolist()
for i in range(len(data1_list)):
if str(data1_list[i]) == str(data2_list[i]):
match_list.append(0) # matching values marked as '0'
else:
match_list.append(1) # non-matching values marked as '1'
return match_list
if __name__ == "__main__":
df1 = pd.read_csv('/path/to/csv1', header=0) # row 0 => column headers
df2 = pd.read_csv('/path/to/csv2', header=0) # row 0 => column headers
match_list = match_columns(df1,df2, 'TV1') # match_list for 'TV1'
print(match_list)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.