对于 model 这种访问模式，有没有比使用两个全局二级索引 (GSI) 更好的方法？

Question

我试图找出数据 model 和应用程序的访问模式，以跟踪不同领域（牧场）之间的动物运动。 有如下运动记录：

PK                 FROM            TO          DATE
------------------------------------------------------
ANIMAL#001       FIELD#A       FIELD#B       January 3
ANIMAL#001       FIELD#Q       FIELD#R       September 19
ANIMAL#002       FIELD#A       FIELD#B       January 3
ANIMAL#003       FIELD#C       FIELD#D       March 15
ANIMAL#005       FIELD#F       FIELD#A       April 22

对于特定领域，例如FIELD#A ，我想知道进出该领域的所有运动、运动的日期和动物的数量。 结果应如下所示：

DATE        FROM        TO          NUMBER_ANIMALS
--------------------------------------------------
January 3   FIELD#A     FIELD#B         2
April 22    FIELD#F     FIELD#A         1

可能的解决方案和尝试：

PK=FROM, SK=TO的 GSI。 如果我用PK=FIELD#A查询 GSI，这只给出图片的一半，即来自FIELD#A运动。 我无法获得FIELD#A动作。
像FIELD#A#FIELD#B这样的复合属性在 GSI 中用作PK 。 遇到与尝试 1 相同的问题。
两个 GSI。 GSI1 有PK=FROM并且 GSI2 有PK=TO 。 我可以使用PK=FIELD#A查询 GSI1 并进行一些后处理（ groupby, count ）以获得部分结果。 然后我可以使用PK=FIELD#A和后处理查询 GSI2，得到结果的 rest。 这看起来可行，但需要两个 GSI 和两个查询。 我不能重载一个 GSI，因为正在使用的两列都来自同一个项目。
我宁愿避免扫描整个表格并过滤结果的某种组合，因为整个表格中可能有 50,000 多个项目。

我可以看到如何使用两个 GSI 来做到这一点，但最有效的方法是什么？

Answer 1

我可以想象一个稍微不同的表结构（ ANIMALID是分区键， FIELDID是排序键）：

ANIMALID | FIELDID | FROM_TO | ...
——————————————————————————————————
ANIMAL#1 | FIELD#A | FROM    | ...
ANIMAL#1 | FIELD#B | TO      | ...
ANIMAL#2 | FIELD#C | FROM    | ...
ANIMAL#2 | FIELD#A | TO      | ...

以及具有以下结构的 GSI：

FIELDID | ANIMALID | ...

然后您可以仅通过FIELDID查询 GSI 并汇总结果。

对于 model 这种访问模式，有没有比使用两个全局二级索引 (GSI) 更好的方法？

问题描述

1 个解决方案

解决方案1
1 已采纳 2020-07-06 21:36:01

对于 model 这种访问模式，有没有比使用两个全局二级索引 (GSI) 更好的方法？

问题描述

1 个解决方案

解决方案1 1 已采纳 2020-07-06 21:36:01

解决方案1
1 已采纳 2020-07-06 21:36:01