遍历python中的字典列表

Question

I have a list of dictionaries in python with the following form: 我有以下格式的python词典列表：

[{'item_value': 0.1, 'date': datetime.datetime(2017, ...), 'item_index': 1.0}, 
{'item_value': 0.22, 'date': datetime.datetime(2016, ...), 'item_index': 0.1}, 
{'item_value': 0.21, 'date': datetime.datetime(2016, ...), 'item_index': 1.0}
 ,..., 
{'item_value': 1.03, 'date': datetime.datetime(2016, ...), 'item_index': 1.0}]

Variable item_index takes values: [0.0, 0.1, 0.2, ..., 1.0] while variable item_value values between [-1, 1]. 可变item_index的取值为： [0.0, 0.1, 0.2, ..., 1.0] 0.0，0.1，0.2 [0.0, 0.1, 0.2, ..., 1.0]而可变item_value的取值在[-1，1]之间。 I want to construct a numpy vector which contain all possible item_index with the most recent item_value using the date (by omitting duplicates with the same item_value and keeping the most recent ones). 我想构造一个numpy向量，该向量包含使用日期的所有可能的item_index和最近的item_value （通过删除具有相同item_value的重复项并保留最新的值）。

I am using the proposed solution: 我正在使用建议的解决方案：

np.array([d["item_value"] for d in sorted(my_list, key=lambda x: x["date"]))}

I create a numpy vector which contain all item_values sorted concerning the date [1.03, 0.22, 0.21, 0.1] in the case of the example. 在本示例中，我创建了一个numpy向量，其中包含与日期[1.03, 0.22, 0.21, 0.1] 1.03，0.22，0.21，0.1]有关的所有item_values排序。 However, I want to return a vector like the following example: 但是，我想返回一个矢量，如下例所示：

[0, 0.22, 0, 0, 0, 0, 0, 0, 0, 0.1]

Each position of vector to represent the 11 possible values for item_index and have as a value the most recent value of the item_value. 向量的每个位置代表item_index的11个可能值，并具有item_value的最新值作为值。 How can I do so? 我该怎么办？

EDIT 编辑

One example can be: 一个示例可以是：

[{'item_value': 0.0, 'date': datetime.datetime(2017, 10, 11, 13, 39, 36, 979000), 'item_index': 1.0}
{'item_value': 0.0, 'date': datetime.datetime(2017, 10, 11, 13, 40, 2, 368000), 'item_index': 1.0}
{'item_value': -1.0, 'date': datetime.datetime(2017, 10, 23, 9, 35, 20, 741000), 'item_index': 1.0}
{'item_value': -1.0, 'date': datetime.datetime(2017, 10, 23, 9, 35, 41, 915000), 'item_index': 0.8}
{'item_value': 0.0, 'date': datetime.datetime(2017, 10, 23, 9, 36, 2, 763000), 'item_index': 0.5}
{'item_value': 0.0, 'date': datetime.datetime(2017, 10, 23, 11, 40, 22, 427000), 'item_index': 1.0}
{'item_value': 0.0, 'date': datetime.datetime(2017, 11, 14, 7, 33, 9, 131000), 'item_index': 1.0}
{'item_value': 0.51, 'date': datetime.datetime(2017, 11, 15, 12, 50, 25, 14000), 'item_index': 1.0}
{'item_value': 0.0, 'date': datetime.datetime(2018, 1, 19, 14, 15, 46, 761000), 'item_index': 1.0}
{'item_value': -0.49, 'date': datetime.datetime(2018, 1, 19, 14, 16, 30, 207000), 'item_index': 1.0}
{'item_value': -0.009000000000000005, 'timestamp': datetime.datetime(2018, 1, 19, 16, 32, 30, 631000), 'item_index': 1.0}
{'item_value': 0.0, 'date': datetime.datetime(2018, 1, 19, 16, 33, 19, 509000), 'item_index': 1.0}
{'item_value': 0.0, 'date': datetime.datetime(2018, 1, 19, 16, 44, 59, 483000), 'item_index': 1.0}
{'item_value': -0.33299999999999996, 'date': datetime.datetime(2018, 1, 19, 18, 13, 17, 67000), 'item_index': 1.0}
{'item_value': 1.0, 'date': datetime.datetime(2018, 1, 19, 18, 13, 48, 443000), 'item_index': 1.0}
{'item_value': -0.33299999999999996, 'date': datetime.datetime(2018, 1, 19, 18, 14, 22, 871000), 'item_index': 1.0}
{'item_value': 0.0, 'date': datetime.datetime(2018, 1, 28, 11, 45, 48, 223000), 'item_index': 1.0}
{'item_value': 0.005000000000000003, 'timestamp': datetime.datetime(2018, 1, 28, 11, 46, 7, 481000), 'item_index': 1.0}
{'item_value': 0.0, 'date': datetime.datetime(2018, 1, 28, 11, 46, 27, 845000), 'item_index': 1.0}
{'item_value': 0.0, 'date': datetime.datetime(2018, 1, 28, 11, 46, 50, 386000), 'item_index': 1.0}]

Answer 1

A oneliner could be as follows: 单行代码可能如下：

indexes = [0.0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0]

my_filtered_lists = [sorted([d for d in my_list if d['item_index'] == i], 
                            key=lambda x: x["date"])
                        for i in indexes ]

result = [l[-1]['item_value'] if len(l)>0 else 0  for l in my_filtered_lists]

For each index you filter the list, and sort each filtered list as desired and get the item_value of the last element. 对于每个索引，您都将过滤列表，并根据需要对每个过滤后的列表进行排序，并获取最后一个元素的item_value 。 If the data set is big enough, this could be a little memory demanding, since you are creating one extra list for each item_idex . 如果数据集足够大，则可能需要一点内存，因为您要为每个item_idex创建一个额外的列表。

Tested with: 经过测试：

 my_list = [
{'item_value': 0.1, 'date': datetime.datetime(2017, 05, 01), 'item_index': 1.0}, 
{'item_value': 0.22, 'date': datetime.datetime(2016,05,01), 'item_index': 0.1}, 
{'item_value': 0.21, 'date': datetime.datetime(2017, 05, 01), 'item_index': 0.1},
{'item_value': 1.03, 'date': datetime.datetime(2016,05,01), 'item_index': 1.0}]

It returns: [0, 0.21, 0, 0, 0, 0, 0, 0, 0, 0, 0.1] wich I understand is the expected output. 它返回： [0, 0.21, 0, 0, 0, 0, 0, 0, 0, 0, 0.1] 0，0.21，0，0，0，0，0，0，0，0，0.1 [0, 0.21, 0, 0, 0, 0, 0, 0, 0, 0, 0.1]我所知是预期的输出。

Answer 2

One solution would be to create an intermediate dict key -> value only keeping the most up-to-date values: 一种解决方案是创建一个中间dict key -> value仅保留最新值：

d = dict()
for value in sorted(my_list, key=lambda x: x["date"]):
   d[value['item_index']] = d[value['item_value']]

Another solution would be to convert the list to a pandas DataFrame , sort by date, group by item_index with the last() function to only keep the latest record of the dataframe. 另一个解决方案是使用last()函数将列表转换为pandas DataFrame ，按日期排序，按item_index分组，以仅保留数据帧的最新记录。

遍历python中的字典列表

问题描述

2 个解决方案

解决方案1
3 已采纳 2018-04-08 19:19:51

解决方案2
2 2018-04-08 19:09:36

遍历python中的字典列表

问题描述

2 个解决方案

解决方案1 3 已采纳 2018-04-08 19:19:51

解决方案2 2 2018-04-08 19:09:36

解决方案1
3 已采纳 2018-04-08 19:19:51

解决方案2
2 2018-04-08 19:09:36