蟒蛇：扁平化列表，同时保留某些索引的嵌套结构

Question

我在Python中找到了几篇关于扁平化/折叠列表的文章，但没有一篇涉及这种情况：

输入：

[a_key_1, a_key_2, a_value_1, a_value_2]
[b_key_1, b_key_2, b_value_1, b_value_2]
[a_key_1, a_key_2 a_value_3, a_value_4]
[a_key_1, a_key_3, a_value_5, a_value_6]

输出：

[a_key_1, a_key_2, [a_value1, a_value3], [a_value_2, a_value_4]]
[b_key_1, b_key_2, [b_value1], [b_value_2]]
[a_key_1, a_key_3, [a_value_5], [a_value_6]]

我想展平列表，以便每个唯一键集只有一个条目，其余值组合到这些唯一键旁边的嵌套列表中。

编辑：输入中的前两个元素将始终是键； 最后两个元素将始终是值。

这可能吗？

Answer 1

是的，有可能。 这是一个执行任务的函数（带有来自输入/输出的doctest）：

#!/usr/bin/env python
"""Flatten lists as per http://stackoverflow.com/q/30387083/253599."""

from collections import OrderedDict


def flatten(key_length, *args):
    """
    Take lists having key elements and collect remainder into result.

    >>> flatten(1,
    ...         ['A', 'a1', 'a2'],
    ...         ['B', 'b1', 'b2'],
    ...         ['A', 'a3', 'a4'])
    [['A', ['a1', 'a2'], ['a3', 'a4']], ['B', ['b1', 'b2']]]

    >>> flatten(2,
    ...         ['A1', 'A2', 'a1', 'a2'],
    ...         ['B1', 'B2', 'b1', 'b2'],
    ...         ['A1', 'A2', 'a3', 'a4'],
    ...         ['A1', 'A3', 'a5', 'a6'])
    [['A1', 'A2', ['a1', 'a2'], ['a3', 'a4']], ['B1', 'B2', ['b1', 'b2']], ['A1', 'A3', ['a5', 'a6']]]
    """
    result = OrderedDict()
    for vals in args:
        result.setdefault(
            tuple(vals[:key_length]), [],
        ).append(vals[key_length:])
    return [
        list(key) + list(vals)
        for key, vals
        in result.items()
    ]


if __name__ == '__main__':
    import doctest
    doctest.testmod()

（已编辑，可同时处理原始问题和已编辑的问题）

Answer 2

data = [
    ["a_key_1", "a_key_2", "a_value_1", "a_value_2"],
    ["b_key_1", "b_key_2", "b_value_1", "b_value_2"],
    ["a_key_1", "a_key_2", "a_value_3", "a_value_4"],
    ["a_key_1", "a_key_3", "a_value_5", "a_value_6"],
]

from itertools import groupby
keyfunc = lambda row: (row[0], row[1])
print [
    list(key) + [list(zipped) for zipped in zip(*group)[2:]]
    for key, group
    in groupby(sorted(data, key=keyfunc), keyfunc)
]


# => [['a_key_1', 'a_key_2', ['a_value_1', 'a_value_3'], ['a_value_2', 'a_value_4']],
#     ['a_key_1', 'a_key_3', ['a_value_5'], ['a_value_6']],
#     ['b_key_1', 'b_key_2', ['b_value_1'], ['b_value_2']]]

有关更多信息，请查看Python文档

蟒蛇：扁平化列表，同时保留某些索引的嵌套结构

问题描述

2 个解决方案

解决方案1
3 2015-05-22 02:06:16

解决方案2
1 已采纳 2015-05-22 02:07:36

蟒蛇：扁平化列表，同时保留某些索引的嵌套结构

问题描述

2 个解决方案

解决方案1 3 2015-05-22 02:06:16

解决方案2 1 已采纳 2015-05-22 02:07:36

解决方案1
3 2015-05-22 02:06:16

解决方案2
1 已采纳 2015-05-22 02:07:36