繁体   English   中英

Python-将列表中的每个项目与列表中的其他所有项目进行比较

[英]Python - Comparing each item of a list to every other item in that list

我需要将很长的列表(12471个项目)中的每个项目与同一列表中的其他所有项目进行比较。 以下是我的清单:

[array([3, 4, 5])
array([ 6,  8, 10])
array([ 9, 12, 15])
array([12, 16, 20])
array([15, 20, 25])
...]                 #12471 items long

我需要将每个数组的第二项与其他每个数组的第一项进行比较,以查看它们是否相等。 并且优选地,以非常有效的方式。 在Python 2.x中有没有一种简单有效的方法来做到这一点?


我在这里设计了一种非常粗糙的方法,但是速度非常慢:

ls=len(myList)       #12471
l=ls
k=0
for i in myList:
        k+=1
        while l>=0:
            l-=1
            if i[1]==myList[l][0]:
                #Do stuff
        l=ls

虽然从理论上讲这仍然是N ^ 2的时间(最坏的情况),但它应该会使情况变得更好:

import collections

inval = [[3, 4, 5],
[ 6,  8, 10],
[ 9, 12, 15],
[ 12, 14, 15],
[12, 16, 20],
[ 6,  6, 10],
[ 8,  8, 10],
[15, 20, 25]]

by_first = collections.defaultdict(list)
by_second = collections.defaultdict(list)

for item in inval:
    by_first[item[0]].append(item)
    by_second[item[1]].append(item)

for k, vals in by_first.items():
    if k in by_second:
        print "by first:", vals, "by second:", by_second[k]

我的简单案例的输出:

by first: [[6, 8, 10], [6, 6, 10]] by second: [[6, 6, 10]]
by first: [[8, 8, 10]] by second: [[6, 8, 10], [8, 8, 10]]
by first: [[12, 14, 15], [12, 16, 20]] by second: [[9, 12, 15]]

虽然这不处理重复项。

我们可以在O(N)中执行此操作,并假设python dict花费O(1)的时间进行插入和查找。

  1. 在第一次扫描中,我们通过扫描整个列表来创建一个存储第一个数字和行索引的地图
  2. 在第二次扫描中,我们发现第一次扫描中的map是否包含每行的第二个元素。 如果map包含,则map的值将为我们提供与所需条件匹配的行索引列表。
myList = [[3, 4, 5], [ 6,  8, 10], [ 9, 12, 15], [12, 16, 20], [15, 20, 25]]

    first_column = dict()
    for idx, list in enumerate(myList):
        if list[0] in first_column:
            first_column[list[0]].append(idx)
        else:
            first_column[list[0]] = [idx]

    for idx, list in enumerate(myList):
        if list[1] in first_column:
            print ('rows matching for element {} from row {} are {}'.format(list[1], idx,  first_column[list[1]]))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM