[英]Compare a searchlist to each row of csv file using Python
我有一个搜索项目列表:
search = ("EPP3424", "EPP5423", "EPP4567", Continues... )
我想检查csv文件的每一行,其中每一行看起来像这样:
("1206502", "EPP5423", "97334343")
next row...
如果搜索列表中的任何项目出现在csv的行中,请将整行添加到新列表中。
问题是我只能让它匹配一个结果,而似乎无法正确地遍历所有项目。
csvFile = open(fRoot + "\\SearchEPP.csv", 'r')
try:
csvReader = csv.reader(csvFile)
for row in csvReader:
if all(s in row for s in search):
print "Match"
allEPP.append(row)
else:
print "no match"
finally:
csvFile.close()
Python 2.6,Windows 7
更新:
这是我根据您的回复尝试执行的操作,但仍然只返回一条记录。
f = open(fRoot + "\\EPP.txt", "r")
search = list()
for row in f:
search.append(row)
search = set(search)
#search = ("EPP2383", "EPP2384")
allEPP = list()
csvFile = open(fRoot + "\\SearchEPP.csv", 'r')
try:
csvReader = csv.reader(csvFile)
for row in csvReader:
if any(r in search for r in row):
print "Match"
allEPP.append(row)
else:
print "."
finally:
csvFile.close()
if all(s in row for s in search):
应该可能是:
if any(s in row for s in search):
请注意,执行此操作的更好方法是将search
一次转换为集合:
search = set(search)
...
然后检查set
(而不是tuple
)。 set
成员资格测试通常为O(1),而元组的成员资格测试为O(n)。
if any(r in search for r in row):
甚至:
if search.intersection(row):
...
尽管any
解决方案都可能更快(取决于row
大小以及通过交集创建新集合的开销与生成器表达式的开销之间的关系)。
正如@RocketDonkey所建议的那样,您的“搜索”列表中可能会有换行符,这仍然在更新的代码中引起问题。 这是一个解决方法:
with open(fRoot + "\\EPP.txt", "r") as f:
search = set(line.rstrip('\n') for line in f)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.