[英]Python - Comparing each item of a list to every other item in that list
我需要将很长的列表(12471个项目)中的每个项目与同一列表中的其他所有项目进行比较。 以下是我的清单:
[array([3, 4, 5])
array([ 6, 8, 10])
array([ 9, 12, 15])
array([12, 16, 20])
array([15, 20, 25])
...] #12471 items long
我需要将每个数组的第二项与其他每个数组的第一项进行比较,以查看它们是否相等。 并且优选地,以非常有效的方式。 在Python 2.x中有没有一种简单有效的方法来做到这一点?
我在这里设计了一种非常粗糙的方法,但是速度非常慢:
ls=len(myList) #12471
l=ls
k=0
for i in myList:
k+=1
while l>=0:
l-=1
if i[1]==myList[l][0]:
#Do stuff
l=ls
虽然从理论上讲这仍然是N ^ 2的时间(最坏的情况),但它应该会使情况变得更好:
import collections
inval = [[3, 4, 5],
[ 6, 8, 10],
[ 9, 12, 15],
[ 12, 14, 15],
[12, 16, 20],
[ 6, 6, 10],
[ 8, 8, 10],
[15, 20, 25]]
by_first = collections.defaultdict(list)
by_second = collections.defaultdict(list)
for item in inval:
by_first[item[0]].append(item)
by_second[item[1]].append(item)
for k, vals in by_first.items():
if k in by_second:
print "by first:", vals, "by second:", by_second[k]
我的简单案例的输出:
by first: [[6, 8, 10], [6, 6, 10]] by second: [[6, 6, 10]]
by first: [[8, 8, 10]] by second: [[6, 8, 10], [8, 8, 10]]
by first: [[12, 14, 15], [12, 16, 20]] by second: [[9, 12, 15]]
虽然这不处理重复项。
我们可以在O(N)中执行此操作,并假设python dict花费O(1)的时间进行插入和查找。
myList = [[3, 4, 5], [ 6, 8, 10], [ 9, 12, 15], [12, 16, 20], [15, 20, 25]] first_column = dict() for idx, list in enumerate(myList): if list[0] in first_column: first_column[list[0]].append(idx) else: first_column[list[0]] = [idx] for idx, list in enumerate(myList): if list[1] in first_column: print ('rows matching for element {} from row {} are {}'.format(list[1], idx, first_column[list[1]]))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.