[英]Merge tuples having atleast one common element to form a common tuple
我有一个这样的元组列表
l = [('hin1','ie2',2),('hin1','ie3',2),('hin4','ie5',2),('hin6','ie22',2),('hin1','ie32',2),('hin31','ie2',2),('hin61','ie62',2)]
我想合并在两者之间共享至少一个共同元素的元组
因此-这样的两个元组:
('hin1','ie2',2),('hin1','ie3',2) should result in
(('hin1','ie2', 'ie3')
对于上面的列表l,我的最终输出应该是这样的
output - [(hin1,ie2,ie3,ie32,hin31),(hin4,ie5),(hin6,ie22),(hin61,ie62)]
注意-每个元组的第三个元素都可以忽略
有任何起点吗?
这是一个网络分析问题。 如果您不想编写自己的算法来解决它,则可以使用igraph
包:
import igraph
# build the graph object
g = igraph.Graph()
edges, vertices = set(), set()
for e in l:
vertices.update(e[:2])
edges.add(e[:2])
g.add_vertices(list(vertices))
g.add_edges(list(edges))
# decompose the graph into sub graphs based on vertices connection
[[v['name'] for v in sg.vs()] for sg in g.decompose(mode="weak")]
#[['ie2', 'hin1', 'ie32', 'hin31', 'ie3'],
# ['hin6', 'ie22'],
# ['hin61', 'ie62'],
# ['hin4', 'ie5']]
我在这里写了一个开始,而不是整个功能。 但是看看这种方法,我认为您可以从中推论得出。 当只有2的重叠量满足所有选项时,它将返回正确的输出,除了'hin1'具有4个不同的重叠量。 如果您重复一般概念并稍作调整,我想您可以解决!
tuples_list = [('hin1','ie2',2),('hin1','ie3',2),('hin4','ie5',2),('hin6','ie22',2),('hin1','ie32',2),('hin31','ie2',2),('hin61','ie62',2)]
for tuple in tuples_list:
for tup in tuples_list:
if tuple[0] == tup[0]:
new_tup = (tuple[0],tuple[1],tup[1])
print new_tup
这将返回以下列表:
('hin1', 'ie2', 'ie2')
('hin1', 'ie2', 'ie3')
('hin1', 'ie2', 'ie32')
('hin1', 'ie3', 'ie2')
('hin1', 'ie3', 'ie3')
('hin1', 'ie3', 'ie32')
('hin4', 'ie5', 'ie5')
('hin6', 'ie22', 'ie22')
('hin1', 'ie32', 'ie2')
('hin1', 'ie32', 'ie3')
('hin1', 'ie32', 'ie32')
('hin31', 'ie2', 'ie2')
('hin61', 'ie62', 'ie62')
然后可以将其用作第二遍的输入。 这只是一种方法。 我敢肯定还有更好的解决方案,但我希望这对您来说是一个不错的开始!
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.