使用什么数据结构来表示条形图

Question

问题的确超出了标题允许我指定的范围。 我有一个大文件，按接收顺序和与之对应的时间戳表示无序编号的数据包，例如（为清楚起见，包括箭头，但实际上不在文件中）：

seq_1 ---->时间戳

seq_2 ---->时间戳

seq_3 ---->时间戳

seq_2 ---->时间戳

seq_5 ---->时间戳

seq_4 ---->时间戳

...

时间戳总是会增加，但是我可能会重复复制数据包，使数据包乱序等。我已将文件解析为字符串列表，并且现在必须考虑到我需要确定适当的数据结构以保存它：

删除所有重复的序列号，仅保留第一个到达的序列号。
获取按序列号排序的有序可迭代结构。

我的想法是，我可以绘制（尽管实际上不打算这样做）图形条，x轴是序列号，y轴是时间戳。 我需要手动查找局部最大值和最小值，因此我应该能够访问任何条目的相邻条目。

我考虑过将行列表解析为(sequence_number, timestamp)的dictionary ，小心地不覆盖现有条目（条件1），然后将其转换为tuple list ，最后按key对list进行排序。 list应该允许我访问相邻的条目，从而满足条件2。解析的文件很大，因此我想知道是否存在一种可以更好地扩展的解决方案 （不需要在两个数据结构之间转换+后验排序）。

Answer 1

最简单的选择是将内容转储到字典中并在最后对键进行排序。 d.get调用可确保它保留第一个遇到的值（如果存在的话），或者插入不存在的新值。

In [23]: s = """seq_1 ----> timestamp1
   ....: seq_2 ----> timestamp2
   ....: seq_3 ----> timestamp3
   ....: seq_2 ----> timestamp4
   ....: seq_5 ----> timestamp5
   ....: seq_4 ----> timestamp6
   ....: seq_9 ----> timestamp7
   ....: seq_10 ----> timestamp8
   ....: seq_6 ----> timestamp9
   ....: seq_7 ----> timestamp10
   ....: seq_2 ----> timestamp11
   ....: seq_4 ----> timestamp12"""

In [24]: d = {}

In [25]: for line in s.split("\n"):
    seq, ts = map(str.strip, line.split("---->"))
    d[seq] = d.get(seq, ts)
   ....:

In [26]: sorted(d.items(), key=lambda x: int(x[0][4:]))
Out[26]:
[('seq_1', 'timestamp1'),
 ('seq_2', 'timestamp2'),
 ('seq_3', 'timestamp3'),
 ('seq_4', 'timestamp6'),
 ('seq_5', 'timestamp5'),
 ('seq_6', 'timestamp9'),
 ('seq_7', 'timestamp10'),
 ('seq_9', 'timestamp7'),
 ('seq_10', 'timestamp8')]

使用什么数据结构来表示条形图

问题描述

1 个解决方案

解决方案1
1 已采纳 2015-10-30 20:29:29

使用什么数据结构来表示条形图

问题描述

1 个解决方案

解决方案1 1 已采纳 2015-10-30 20:29:29

解决方案1
1 已采纳 2015-10-30 20:29:29