繁体   English   中英

将字符串列表转换为字典字典

[英]Converting List of String to Dictionary of Dictionary

初始输入:-

elements = ['description:',
            '- Hello, Welcome',
            '- Welcome back',
            'type:',
            '- new',
            '- existing',
            'updated_at:',
            '- 2017-12-20 09:06:20.599415000 Z',
            '- 2017-12-20 09:08:50.398076080 Z'
]

对于上下文,我想将上面的list转换为dictdict 我还在学习 Python 所以我的解释可能不太好。

如果字符串中有冒号,则将其用作键。 理想output请参考下文。

理想output:-

{
    'description': {
        'before': 'Hello, Welcome', 
        'after': 'Welcome back'
    }, 
    'type': {
        'before': 'new', 
        'after': 'existing'
    }, 
    'updated_at': {
        'before': '2017-12-20 09:06:20.599415000 Z', 
        'after': '2017-12-20 09:08:50.398076080 Z'
    }
}

这是我目前所拥有的。 但是,它只适用于第 1 行。rest 不会产生我想要的。 目前,这只处理一个元素。 我希望它也能够处理一整列。

elements = df['details'][3].split('\n')[1:]
clean_elements = []
for element in elements:
    if ':' not in element:
        clean_elements[-1] = clean_elements[-1] + element
    else:
        clean_elements.append(element)
clean_elements

data = {}

for element in clean_elements:
    element = element.split(': ')
    data[element[0]] = element[1]

这是将初始输入转换为所需 output 的一种方法。 我不打结您的 dataframe 的内容,所以我在这里假设elements包含初始输入列表,如您帖子中的屏幕截图所示。

elements = ['description:', '- Hello, Welcome', '- Welcome back',
            'type:', '- new', '- existing',
            'updated_at:', '- 2017-12 09:06:20.599415999 Z', '- 2017-12 09:08:50.398076080 Z']

output = {}
element_iter = iter(elements)
for e in element_iter:
    if e.endswith(':'):
        before = next(element_iter).lstrip('- ')
        after = next(element_iter).lstrip('- ')
        output[e.rstrip(':')] = {'before': before, 'after': after}

print(output)

假设您的初始输入实际上是一个列表,并且您总是有一个语法,其中有一个键,然后是旧值,然后是新值(包含破折号和空格的值和包含冒号的键),那么您可以循环通过像这样的每3个元素:

initial_input = ['a:','- X', '- Y', 'b:', '- C', '- D', 'c:', '- qweqwe', '- asdasd']
result = {}
for i in range(0, len(initial_input), 3):
    key_name = initial_input[i][:-1]
    before_value = initial_input[i+1][2:]
    after_value = initial_input[i+2][2:]
    result[key_name] = {'before': before_value, 'after': after_value}

print result
# {'a': {'after': 'Y', 'before': 'X'}, 'c': {'after': 'asdasd', 'before': 'qweqwe'}, 'b': {'after': 'D', 'before': 'C'}}

如果初始输入是字符串,则需要事先使用json模块将其解析为列表。

另一个使用dict comprehension的潜在解决方案:

d = {elements[i].strip(':'):{'before': elements[i+1].strip('- '),
                             'after':  elements[i+2].strip('- ')}
     for i in range(0, len(elements), 3)}

[出去]

{'description': {'before': 'Hello, Welcome', 'after': 'Welcome back'},
 'type': {'before': 'new', 'after': 'existing'},
 'updated_at': {'before': '2017-12 09:06:20.599415999 Z',
  'after': '2017-12 09:08:50.398076080 Z'}}

您可以使用 collections 模块afterdeque before . 这使得以后添加更多内容更容易,并且您不会进行太多硬编码。

from collections import deque
elements = ['description:',
            '- Hello, Welcome',
            '- Welcome back',
            'type:',
            '- new',
            '- existing',
            'updated_at:',
            '- 2017-12-20 09:06:20.599415000 Z',
            '- 2017-12-20 09:08:50.398076080 Z'
]
my_dict = dict()
# This assumes the first element will always be a key
current_key = None
inner_keys = deque(['before', 'after'])
for element in elements:
    if element.endswith(':'):
        current_key = element.rstrip(':')
        my_dict[current_key] = dict()
    else:
        my_dict[current_key][inner_keys[0]] = element.lstrip('- ')
        inner_keys.rotate()
print(my_dict)

deque基本上是一个可以在其上旋转元素的集合。 因此,当它具有元素['before', 'after']时对其调用rotate()会将它们的顺序更改为['after', 'before'] ,反之亦然。

所以这里的主要思想是循环遍历elements

当您找到一个以:结尾的字符串时,您就知道它应该是您的字典的键。

在单词after ,循环中接下来的两项将成为字典的before部分。

from collections import defaultdict
current_key = None

out = defaultdict(list)
for elem in elements: 
    # in element ends with : it is a new key
    if elem.strip().endswith(':'):
        current_key = elem.strip(':')
        continue

    assert current_key is not None

    out[current_key].append(elem[2:])
        

我们现在有以下格式的数据:

{
    'description': [
        'Hello, Welcome', 
        'Welcome back'
    ], 
    'type': [
        'new', 
        'existing'
   ], 
    'updated_at': [
        '2017-12-20 09:06:20.599415000 Z', 
        '2017-12-20 09:08:50.398076080 Z'
    ]
}

因此,为了将 map 转换为您想要的字典格式,我们只需遍历项目并将其转换:

for key, value in out.items(): 
    out[key] = dict(zip(['before', 'after'], value))

您也可以使用itertools.groupby 这使得处理每个主键的不同数量的子键变得更容易:

from itertools import groupby as gb
elements = ['description:', '- Hello, Welcome', '- Welcome back', 'type:', '- new', '- existing', 'updated_at:', '- 2017-12-20 09:06:20.599415000 Z', '- 2017-12-20 09:08:50.398076080 Z']
r = [list(b) for _, b in gb(elements, key=lambda x:x.startswith('- '))]
d = {r[i][0][:-1]:dict(zip(['before', 'after'], [k[2:] for k in r[i+1]])) for i in range(0, len(r), 2)}

Output:

{
    "description": {
       "before": "Hello, Welcome",
       "after": "Welcome back"
    },
    "type": {
       "before": "new",
       "after": "existing"
    },
    "updated_at": {
       "before": "2017-12-20 09:06:20.599415000 Z",
       "after": "2017-12-20 09:08:50.398076080 Z"
    }
}

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM