[英]How to find an item in a list that exists as a sub-string in all the items of a list python
[英]Split list by sub-string in item and preserving delimiter
这是输入:
[
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'Some_String',
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'@imp_Some_String',
'Some_String',
'Some_String'
]
这是所需的输出
[
[
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'Some_String'
],
[
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String'
],
[
'@imp_Some_String',
'Some_String',
'Some_String'
]
]
想法是如果我尝试的项目startswith('@imp')
但我的解决方案将在此处创建x,y问题,从而拆分列表。
谢谢。
使用简单的迭代
例如:
data = [
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'Some_String',
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'@imp_Some_String',
'Some_String',
'Some_String'
]
result = []
for i in data: #Iterate items
if i.startswith("@"): #Check if item startswith "@"
result.append([i]) #Append new list with item
else:
result[-1].append(i) #Append item to previous list
print(result)
输出:
[['@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'Some_String'],
['@imp_Some_String', 'Some_String', 'Some_String', 'Some_String'],
['@imp_Some_String', 'Some_String', 'Some_String']]
使用itertools.groupby
例如:
from itertools import groupby
data = [
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'Some_String',
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'@imp_Some_String',
'Some_String',
'Some_String'
]
data = [list(v) for _, v in groupby(data, lambda x: x.startswith("@"))]
result = [i + v for i, v in zip(data[0::2], data[1::2])]
k= [
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'Some_String',
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'@imp_Some_String',
'Some_String',
'Some_String'
]
from itertools import groupby
sol =[]
kk =[list(v) for k,v in groupby(k)]
sol =[kk[i] + kk[i+1]for i in range(0,len(kk)-1,2)]
输出
[['@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'Some_String'],
['@imp_Some_String', 'Some_String', 'Some_String', 'Some_String'],
['@imp_Some_String', 'Some_String', 'Some_String']]
将所有列表元素合并为一行,根据定界符@imp
,将定界符添加回由于拆分而导致的每一行的开头,最后根据空间拆分每一行
>>> list(map(str.split, ('@imp'+s for s in ' '.join(lst).split('@imp') if s)))
[['@imp_Some_String', 'Some_String', 'Some_String', 'Some_String', 'Some_String'], ['@imp_Some_String', 'Some_String', 'Some_String', 'Some_String'], ['@imp_Some_String', 'Some_String', 'Some_String']]
使用itertools.groupby
一种可能的解决方案:
l = [
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'Some_String',
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'@imp_Some_String',
'Some_String',
'Some_String'
]
from itertools import groupby
out = [[*g] for _, g in groupby(l, lambda k, d={'g':0}: (d.update(g=d['g']+1), d['g']) if k.startswith('@imp') else (None, d['g']))]
from pprint import pprint
pprint(out, width=30)
印刷品:
[['@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'Some_String'],
['@imp_Some_String',
'Some_String',
'Some_String',
'Some_String'],
['@imp_Some_String',
'Some_String',
'Some_String']]
您当前的清单:
list_ = [
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'Some_String',
'@imp_Some_String',
'Some_String',
'Some_String',
'Some_String',
'@imp_Some_String',
'Some_String',
'Some_String'
]
创建索引列表:
indexes = [ind for ind, el in enumerate(list_) if el.startswith('@imp')]
得到结果:
res = [list_[i: j] for i, j in zip([0] + indexes, indexes + [None]) if i != j]
print(res) # [['@imp_Some_String', 'Some_String', 'Some_String', 'Some_String', 'Some_String'], ['@imp_Some_String', 'Some_String', 'Some_String', 'Some_String'], ['@imp_Some_String', 'Some_String', 'Some_String']]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.