为每个唯一值创建列表

Question

我目前正在查看具有以下结构的表。

uid | action
 1  |   A1
 1  |   A1
 1  |   A1
 1  |   A4
 2  |   A1
 2  |   A8
 2  |   A9
 3  |   A3
 3  |   A7

我正在尝试使用以下结构创建多维数组。

[[A1, A1, A1, A4], [A1, A8, A9], [A3, A7]]

我的想法是跟踪uid ，并将操作附加到列表中，直到uid键更改为止。 一旦uid键确实更改，所有操作将被追加到另一个数组，并且被跟踪的uid将更改为新的uid 。

我已经使用itertools.groupby()提出了一个过于夸张和不正确的解决方案，但我对此并不满意，并且正在寻找更简单的方法。 但是，我已经解决了这个问题，并提出了更复杂的解决方案。

任何提示将不胜感激。

码：

data = []
for i, j in itertools.groupby(table, key=lambda x: x['uid']):
    event_array = []
    for k in list(j):
        event_array.append(k['action'])
    data.append([i, event_array])

Answer 1

根据OP的评论，

@Black您确定数据已订购吗？

... @thefourtheye，是的，可以肯定的是，在将其读入python之前，我必须先在sql中编写它

例如，由于数据已经排序

>>> data = [{'action': 'A1', 'uid': 1},
...  {'action': 'A1', 'uid': 1},
...  {'action': 'A1', 'uid': 1},
...  {'action': 'A4', 'uid': 1},
...  {'action': 'A1', 'uid': 2},
...  {'action': 'A8', 'uid': 2},
...  {'action': 'A9', 'uid': 2},
...  {'action': 'A3', 'uid': 3},
...  {'action': 'A7', 'uid': 3}]

您可以像使用嵌套列表一样简单地使用groupby本身

>>> [[k['action'] for k in j] for i, j in groupby(data, key=lambda x: x['uid'])]
[['A1', 'A1', 'A1', 'A4'], ['A1', 'A8', 'A9'], ['A3', 'A7']]

Answer 2

您可以使用旧的defaultdict ：

from collections import defaultdict

DATA = [{'uid': uid, 'action': action}
        for uid, action in [(1, 'A1'),
                            (1, 'A1'),
                            (1, 'A1'),
                            (1, 'A4'),
                            (2, 'A1'),
                            (2, 'A8'),
                            (2, 'A9'),
                            (3, 'A3'),
                            (3, 'A7'),]]

d = defaultdict(list)

for data in DATA:
    d[data['uid']].append(data['action'])

print(d.values())

结果将是：

[['A1', 'A1', 'A1', 'A4'], ['A1', 'A8', 'A9'], ['A3', 'A7']]

Answer 3

这应该可以工作，但是groupby看起来已经非常不错了。

uids = {}
for row in table:
    uids.setdefault(row['uid'], []).append(row['action'])

data = [uids[uid] for uid in sorted(uids.keys())]

该解决方案只是简单地遍历table每一行，并确保在uids dict中存在对应uid的列表（使用setdefault ）。 然后，它将针对该行的操作附加到列表中。

因此， uids将是一个字典，其键是UID，值是表中相应动作的序列。

如果你真的想要一个列表的列表（一个“多维数组”），最后一行使用列表理解来构建其元素存储在行动的清单列表uids字典，通过UID排序。

为每个唯一值创建列表

问题描述

3 个解决方案

解决方案1
3 已采纳 2015-03-17 12:30:15

解决方案2
2 2015-03-17 12:22:50

解决方案3
1 2015-03-17 12:29:05

为每个唯一值创建列表

问题描述

3 个解决方案

解决方案1 3 已采纳 2015-03-17 12:30:15

解决方案2 2 2015-03-17 12:22:50

解决方案3 1 2015-03-17 12:29:05

解决方案1
3 已采纳 2015-03-17 12:30:15

解决方案2
2 2015-03-17 12:22:50

解决方案3
1 2015-03-17 12:29:05