如何比较两个csv文件？

Question

I have a csv file1 which is like 我有一个csv file1就像

FLAGSTAFF   AZ  50244.67    5.02    KA1_Podium_Garage_S
FLAGSTAFF   AZ  33752.13    3.38    KA1_Podium_Garage_S
FLAGSTAFF   AZ  11965.5      1.2    KA1_Podium_Garage_S
FLAGSTAFF   AZ  3966.48      0.4    KA1_Podium_Garage_S
SEATTLE     WA  12646.9      1.26   KA1_Podium_Garage_S
SEATTLE     WA  225053.92   22.51   KA1_Podium_Garage_S
SEATTLE     WA  23974.3      2.4    KA1_Podium_Garage_S
SEATTLE     WA  7036.4       0.7    KA1_Podium_Garage_S
SEATTLE     WA  3021.93      0.3    KA1_Podium_Garage_S

I have a csv file 2 which is like , 我有一个csv文件2，就像，

Alabama     AL  1
Alaska      AK  2
Arizona     AZ  4
Arkansas    AR  5
California  CA  6
Colorado    CO  8
Connecticut CT  9
SEATTLE     WA  53

Now i have to append the third column value from csv file2 to csv file1, by comparing second column 现在我必须通过比较第二列将csv file2中的第三列值附加到csv file1

For example it should look like, 例如它应该看起来像，

AZ code is 4 WA code is 53 wherever AZ,WA is there in my csv file1 , the code should get appended into a column AZ代码是4 WA代码是53，无论AZ，WA在我的csv file1中，代码都应该附加到列中

My output should look like, 我的输出应该是这样的，

FLAGSTAFF   AZ  50244.67    5.02    KA1_Podium_Garage_S 4
FLAGSTAFF   AZ  33752.13    3.38    KA1_Podium_Garage_S 4
FLAGSTAFF   AZ  11965.5      1.2    KA1_Podium_Garage_S 4
FLAGSTAFF   AZ  3966.48      0.4    KA1_Podium_Garage_S 4
SEATTLE     WA  12646.9      1.26   KA1_Podium_Garage_S 53
SEATTLE     WA  225053.92   22.51   KA1_Podium_Garage_S 53
SEATTLE     WA  23974.3      2.4    KA1_Podium_Garage_S 53
SEATTLE     WA  7036.4       0.7    KA1_Podium_Garage_S 53
SEATTLE     WA  3021.93      0.3    KA1_Podium_Garage_S 53

Here is the code which i tried, 这是我试过的代码，

with open("/home/sumit/Desktop/CSV_FILE1.csv", "r") as f:
    first = {rows[1]: rows[0:] for rows in list(csv.reader(f))}

# compare second csv and append Code
with open("CSVFILE2.csv", "r") as f1:
    for row in csv.reader(f1):
        if row[1] in first:
            first[row[1]].append(row[2])

# convert dict back to list
merged = [(k,) + tuple(v) for k, v in first.items()]

# write list to output csv
with open("output.csv", "w") as f1:
    csv.writer(f1).writerows(merged)

Output am getting like, 输出我好像，

AZ  FLAGSTAFF   AZ  44230.4 4.42    KA1_Podium_Garage_S 4
WA  SEATTLE     WA  45329.3 4.53    KA1_Podium_Garage_S 53

Answer 1

This line is creating a dictionary, based on state abbreviation, from your first file. 这一行是从你的第一个文件创建一个基于州缩写的字典。 This looks wrong, since a dictionary can only have each key once, and you have multiple rows with "AZ" for example. 这看起来不对，因为字典只能有一次每个键，例如你有多行“AZ”。

first = { rows[1]: rows[0:] for rows in list(csv.reader(f)) }

Instead, you should make your dictionary based on the second file: 相反，您应该根据第二个文件制作字典：

with open("CSVFILE2.csv", "r") as f1:
    code = { row[1]: row[2] for row in csv.reader(f1) }

Then, loop over your first file, and append the appropriate code to each row. 然后，遍历第一个文件，并将相应的代码附加到每一行。

with open("/home/sumit/Desktop/CSV_FILE1.csv", "r") as f:
    merged = [ row + [code[row[1]]] for row in csv.reader(f) ]

And write out the merged data to the new file. 并将合并后的数据写出到新文件中。

Explanation of row + [code[row[1]]] : row + [code[row[1]]] ：

If row is ["FLAGSTAFF", "AZ", 50244.67, 5.02, "KA1_Podium_Garage_S"] , then 如果row是["FLAGSTAFF", "AZ", 50244.67, 5.02, "KA1_Podium_Garage_S"] ，那么

row[1] is "AZ" , row[1]是"AZ" ，
code[row[1]] is code["AZ"] which is 4 , code[row[1]]是code["AZ"] ，它是4 ，
[code[row[1]]] is the list [4] [code[row[1]]]是列表[4]
and row + [code[row[1]] is list concatenation, producing the desired new row value: ["FLAGSTAFF", "AZ", 50244.67, 5.02, "KA1_Podium_Garage_S", 4] 和row + [code[row[1]]是列表串联，产生所需的新行值： ["FLAGSTAFF", "AZ", 50244.67, 5.02, "KA1_Podium_Garage_S", 4]

如何比较两个csv文件？

问题描述

1 个解决方案

解决方案1
2 已采纳 2017-12-06 00:51:49

如何比较两个csv文件？

问题描述

1 个解决方案

解决方案1 2 已采纳 2017-12-06 00:51:49

解决方案1
2 已采纳 2017-12-06 00:51:49