使用Python将搜索列表与csv文件的每一行进行比较

Question

我有一个搜索项目列表：

search = ("EPP3424", "EPP5423", "EPP4567", Continues... )

我想检查csv文件的每一行，其中每一行看起来像这样：

("1206502", "EPP5423", "97334343")
next row...

如果搜索列表中的任何项目出现在csv的行中，请将整行添加到新列表中。

问题是我只能让它匹配一个结果，而似乎无法正确地遍历所有项目。

csvFile = open(fRoot + "\\SearchEPP.csv", 'r')
try:
    csvReader = csv.reader(csvFile)
    for row in csvReader:
        if all(s in row for s in search):
            print "Match"
            allEPP.append(row)
        else:
            print "no match"
finally:
    csvFile.close()

Python 2.6，Windows 7

更新：

这是我根据您的回复尝试执行的操作，但仍然只返回一条记录。

f = open(fRoot + "\\EPP.txt", "r")

search = list()
for row in f:
    search.append(row)

search = set(search)   

#search = ("EPP2383", "EPP2384")

allEPP = list()

csvFile = open(fRoot + "\\SearchEPP.csv", 'r')
try:
    csvReader = csv.reader(csvFile)
    for row in csvReader:
        if any(r in search for r in row):
            print "Match"
            allEPP.append(row)
        else:
            print "."
finally:
    csvFile.close()

Answer 1

if all(s in row for s in search):

应该可能是：

if any(s in row for s in search):

请注意，执行此操作的更好方法是将search一次转换为集合：

search = set(search)
...

然后检查set （而不是tuple ）。 set成员资格测试通常为O（1），而元组的成员资格测试为O（n）。

if any(r in search for r in row):

甚至：

if search.intersection(row):
   ...

尽管any解决方案都可能更快（取决于row大小以及通过交集创建新集合的开销与生成器表达式的开销之间的关系）。

正如@RocketDonkey所建议的那样，您的“搜索”列表中可能会有换行符，这仍然在更新的代码中引起问题。 这是一个解决方法：

with open(fRoot + "\\EPP.txt", "r") as f:
    search = set(line.rstrip('\n') for line in f)

使用Python将搜索列表与csv文件的每一行进行比较

问题描述

1 个解决方案

解决方案1
3 已采纳 2012-11-05 15:49:16

使用Python将搜索列表与csv文件的每一行进行比较

问题描述

1 个解决方案

解决方案1 3 已采纳 2012-11-05 15:49:16

解决方案1
3 已采纳 2012-11-05 15:49:16