[英]Given a list of lists in Python, return the maximum length uniquely-valued sublists
我在Python中有以下列表:
l = [[2], [3], [2, 2], [5], [2], [3], [7], [2, 2, 2], [3, 3], [2], [5], [11], [2, 2], [3], [13], [2], [7], [3], [5], [2, 2, 2, 2], [17], [2], [3, 3], [19], [2, 2], [5]]
我想编写一个函数,该函数将返回最大长度的唯一值子列表。 在这种情况下,该函数将返回:
l = [[5], [7], [3, 3], [11], [13], [2, 2, 2, 2], [17], [19]]
我仍然是python的初学者,但是对于如何编写这样的函数我几乎一无所知。 我最了解的是,我可以使用嵌套循环对子列表进行迭代。 但是从我对Python的了解来看,似乎必须有比使用循环更简单的方法来返回要查找的列表。
更新:
这是我在执行代码的方法:解决项目euler#5,这是一种非蛮力的方法!
我确信此代码可以重构,但是无论如何。
伙计们,谢谢您的帮助。 itemgetter
正是我所需要的。
#!/usr/bin/python
# coding = UTF-8
import argparse, sys, math
from itertools import groupby
from collections import defaultdict
from operator import itemgetter
parser = argparse.ArgumentParser()
parser.add_argument('filename', nargs='?')
args = parser.parse_args()
if args:
intinput = int(sys.argv[1])
elif not sys.stdin.isatty():
intinput = int(sys.stdin.read())
else:
parser.print_help()
def prime_factorize(n):
factors = []
number = math.fabs(n)
while number > 1:
factor = get_next_prime_factor(number)
factors.append(factor)
number /= factor
if n < -1:
factors[0] = -factors[0]
return factors
def get_next_prime_factor(n):
if n % 2 == 0:
return 2
for x in range(3, int(math.ceil(math.sqrt(n)) + 1), 2):
if n % x == 0:
return x
return int(n)
def mkfactors(n):
tpf = []
for i in range(n+1):
tpf.extend(prime_factorize(i))
return tpf
l = [list(g) for k,g in groupby(mkfactors(intinput))]
m = [max(g) for _,g in groupby(sorted(l,key=itemgetter(0)),key=itemgetter(0))]
prod = 1
for list in m:
for element in list:
prod *= element
print prod
如果您知道每个子列表都具有相同的元素,则可以执行以下操作:
l = [[2], [3], [2, 2], [5], [2], [3], [7], [2, 2, 2], [3, 3], [2], [5], [11], [2, 2], [3], [13], [2], [7], [3], [5], [2, 2, 2, 2], [17], [2], [3, 3], [19], [2, 2], [5]]
from collections import defaultdict
my_dict = defaultdict(list)
for ele in l:
if len(my_dict[ele[0]]) < len(ele):
my_dict[ele[0]] = ele
结果:
>>> my_dict.values()
[[2, 2, 2, 2], [3, 3], [5], [7], [11], [13], [17], [19]]
此处最简单的操作是使用使问题变得简单的数据结构,然后您可以在事后再转换回去。
例如, dict
将键(素数)映射到长度(指数)很容易。 所以:
>>> l = [[2], [3], [2, 2], [5], [2], [3], [7], [2, 2, 2], [3, 3], [2], [5], [11], [2, 2], [3], [13], [2], [7], [3], [5], [2, 2, 2, 2], [17], [2], [3, 3], [19], [2, 2], [5]]
>>> d = {}
>>> for sublist in l:
... value, count = sublist[0], len(sublist)
... if count > d.get(value, 0):
... d[value] = count
>>> d
{2: 4, 3: 2, 5: 1, 7: 1, 11: 1, 13: 1, 17: 1, 19: 1}
很明显如何将其转换为list
的list
,因此我将其留给您。
请注意,这会丢失订单,但是您可以使用OrderedDict
进行简单修复。 它也失去list
身份例如, [2, 2, 2, 2]
你找回在年底将等于 ,但不一样的 ,原来的[2, 2, 2, 2]
但这也很容易解决-只需直接存储sublist
即可,而不是使用count
。 无论如何,我认为这些都不与您的问题有关。
l = [[2], [3], [2, 2], [5], [2], [3], [7], [2, 2, 2], [3, 3], [2], [5], [11], [2, 2], [3], [13], [2], [7], [3], [5], [2, 2, 2, 2], [17], [2], [3, 3], [19], [2, 2], [5]]
l = [max(i for i in l if j in i) for j in (2, 3, 5, 7, 11, 13, 17, 19)]
print(l)
# [[2, 2, 2, 2], [3, 3], [5], [7], [11], [13], [17], [19]]
我想这只是嵌套嵌套的for循环的列表理解,但是效果很好。
使用collections.Counter
和sets
:
In [47]: s=set([x[0] for x in lis])
In [48]: c=[Counter(x) for x in lis]
In [49]: [max(c,key=lambda y:y[x]) for x in s]
Out[49]:
[Counter({2: 4}),
Counter({3: 2}),
Counter({5: 1}),
Counter({7: 1}),
Counter({11: 1}),
Counter({13: 1}),
Counter({17: 1}),
Counter({19: 1})]
其他方式:
In [64]: from collections import defaultdict
In [65]: d=defaultdict(list)
In [66]: for x in lis:
d[x[0]].append(len(x))
....:
In [67]: [[x]*max(y) for x,y in d.items()]
Out[67]: [[2, 2, 2, 2], [3, 3], [5], [7], [11], [13], [17], [19]]
from itertools import groupby
from operator import itemgetter
[max(g) for _,g in groupby(sorted(l),key=itemgetter(0))]
出:
[[2, 2, 2, 2], [3, 3], [5], [7], [11], [13], [17], [19]]
一个简单的解决方案是将排序后的列表转换为以key为列表的第一个元素的字典,最终将根据key删除重复项。
>>> {e[0]: e for e in sorted(l)}.values()
[[2, 2, 2, 2], [3, 3], [5], [7], [11], [13], [17], [19]]
对于Python版本<2.7,无法使用dict理解
>>> dict((e[0], e) for e in sorted(l)).values()
[[2, 2, 2, 2], [3, 3], [5], [7], [11], [13], [17], [19]]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.