按项目中的子字符串拆分列表并保留定界符

Question

这是输入：

[
    '@imp_Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    '@imp_Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    '@imp_Some_String',
    'Some_String',
    'Some_String'
]

这是所需的输出

[
    [
        '@imp_Some_String',
        'Some_String',
        'Some_String',
        'Some_String',
        'Some_String'
    ],
    [
        '@imp_Some_String',
        'Some_String',
        'Some_String',
        'Some_String'
    ],
    [
        '@imp_Some_String',
        'Some_String',
        'Some_String'
    ]
]

想法是如果我尝试的项目startswith('@imp')但我的解决方案将在此处创建x，y问题，从而拆分列表。

谢谢。

Answer 1

使用简单的迭代

例如：

data = [
    '@imp_Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    '@imp_Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    '@imp_Some_String',
    'Some_String',
    'Some_String'
]

result = []
for i in data:              #Iterate items
    if i.startswith("@"):   #Check if item startswith "@"
        result.append([i])  #Append new list with item
    else:
        result[-1].append(i)   #Append item to previous list

print(result)

输出：

[['@imp_Some_String',
  'Some_String',
  'Some_String',
  'Some_String',
  'Some_String'],
 ['@imp_Some_String', 'Some_String', 'Some_String', 'Some_String'],
 ['@imp_Some_String', 'Some_String', 'Some_String']]

使用itertools.groupby

例如：

from itertools import groupby
data = [
    '@imp_Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    '@imp_Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    '@imp_Some_String',
    'Some_String',
    'Some_String'
]

data = [list(v) for _, v in groupby(data, lambda x: x.startswith("@"))]
result = [i + v for i, v in zip(data[0::2], data[1::2])]

Answer 2

k= [
    '@imp_Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    '@imp_Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    '@imp_Some_String',
    'Some_String',
    'Some_String'
]
from itertools import groupby
sol =[]
kk =[list(v) for  k,v in groupby(k)]
sol =[kk[i] + kk[i+1]for i in range(0,len(kk)-1,2)]

输出

[['@imp_Some_String',
  'Some_String',
  'Some_String',
  'Some_String',
  'Some_String'],
 ['@imp_Some_String', 'Some_String', 'Some_String', 'Some_String'],
 ['@imp_Some_String', 'Some_String', 'Some_String']]

Answer 3

将所有列表元素合并为一行，根据定界符@imp ，将定界符添加回由于拆分而导致的每一行的开头，最后根据空间拆分每一行

>>> list(map(str.split, ('@imp'+s for s in ' '.join(lst).split('@imp') if s)))
[['@imp_Some_String', 'Some_String', 'Some_String', 'Some_String', 'Some_String'], ['@imp_Some_String', 'Some_String', 'Some_String', 'Some_String'], ['@imp_Some_String', 'Some_String', 'Some_String']]

Answer 4

使用itertools.groupby一种可能的解决方案：

l = [
    '@imp_Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    '@imp_Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    '@imp_Some_String',
    'Some_String',
    'Some_String'
]

from itertools import groupby

out = [[*g] for _, g in groupby(l, lambda k, d={'g':0}: (d.update(g=d['g']+1), d['g']) if k.startswith('@imp') else (None, d['g']))]

from pprint import pprint
pprint(out, width=30)

印刷品：

[['@imp_Some_String',
  'Some_String',
  'Some_String',
  'Some_String',
  'Some_String'],
 ['@imp_Some_String',
  'Some_String',
  'Some_String',
  'Some_String'],
 ['@imp_Some_String',
  'Some_String',
  'Some_String']]

Answer 5

您当前的清单：

list_ = [
    '@imp_Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    '@imp_Some_String',
    'Some_String',
    'Some_String',
    'Some_String',
    '@imp_Some_String',
    'Some_String',
    'Some_String'
]

创建索引列表：

indexes = [ind for ind, el in enumerate(list_) if el.startswith('@imp')]

得到结果：

res = [list_[i: j] for i, j in zip([0] + indexes, indexes + [None]) if i != j]

print(res) # [['@imp_Some_String', 'Some_String', 'Some_String', 'Some_String', 'Some_String'], ['@imp_Some_String', 'Some_String', 'Some_String', 'Some_String'], ['@imp_Some_String', 'Some_String', 'Some_String']]

按项目中的子字符串拆分列表并保留定界符

问题描述

5 个解决方案

解决方案1
2 已采纳 2019-08-01 11:20:01

解决方案2
1 2019-08-01 11:51:27

解决方案3
1 2019-08-01 12:49:18

解决方案4
0 2019-08-01 11:30:45

解决方案5
0 2019-08-01 11:32:12

按项目中的子字符串拆分列表并保留定界符

问题描述

5 个解决方案

解决方案1 2 已采纳 2019-08-01 11:20:01

解决方案2 1 2019-08-01 11:51:27

解决方案3 1 2019-08-01 12:49:18

解决方案4 0 2019-08-01 11:30:45

解决方案5 0 2019-08-01 11:32:12

解决方案1
2 已采纳 2019-08-01 11:20:01

解决方案2
1 2019-08-01 11:51:27

解决方案3
1 2019-08-01 12:49:18

解决方案4
0 2019-08-01 11:30:45

解决方案5
0 2019-08-01 11:32:12