postgres：从表中获取随机条目 - 太慢了

Question

在我的postgres数据库中，我有以下关系（为了这个问题简化）：

Objects (currently has about 250,000 records)
-------
n_id
n_store_object_id (references store.n_id, 1-to-1 relationship, some objects don't have store records)
n_media_id (references media.n_id, 1-to-1 relationship, some objects don't have media records)

Store (currently has about 100,000 records)
-----
n_id
t_name,
t_description,
n_status,
t_tag

Media
-----
n_id
t_media_path

到现在为止还挺好。 当我需要查询数据时，我运行它（注意最后的limit 2 ，作为要求的一部分）：

select
    o.n_id,
    s.t_name,
    s.t_description,
    me.t_media_path
from
    objects o
    join store s on (o.n_store_object_id = s.n_id and s.n_status > 0 and s.t_tag is not null)
    join media me on o.n_media_id = me.n_id
limit
    2

这工作正常，并按预期返回两个条目。 这个执行时间大约是20毫秒 - 就好了。

现在，每次查询运行时我都需要输入2个随机条目。 我以为我会order by random()添加order by random() ，如下所示：

select
    o.n_id,
    s.t_name,
    s.t_description,
    me.t_media_path
from
    objects o
    join store s on (o.n_store_object_id = s.n_id and s.n_status > 0 and s.t_tag is not null)
    join media me on o.n_media_id = me.n_id
order by
    random()
limit
    2

虽然这给出了正确的结果，但执行时间现在约为2,500毫秒（超过2秒）。 这显然是不可接受的，因为它是为了在Web应用程序中获取页面数据而运行的大量查询之一。

所以，问题是：如何获得随机条目，如上所述，但仍然将执行时间保持在一段合理的时间内（即100毫秒以下是否可以接受）？

Answer 1

当然，它需要在获得第一行之前根据随机标准对整个事物进行排序。 也许你可以通过在offset使用random()来解决这个问题？

Answer 2

以下是关于该主题的一些以前的工作可能会有所帮助：

http://blog.rhodiumtoad.org.uk/2009/03/08/selecting-random-rows-from-a-table/

Answer 3

我想你最好先选择随机对象，然后在选择后对这些对象进行连接。 即，查询一次以选择随机对象，然后再次查询以仅连接所选择的那些对象。

Answer 4

看起来你的问题是：你有一个250,000行的表，需要两个随机行。 因此，您必须生成250,000个随机数，然后按行数对行进行排序。 两秒钟这样做对我来说似乎相当快。

加速选择的唯一真正方法是不必提供250,000个随机数，而是通过索引查找行。

我认为您必须更改表架构以针对此情况进行优化。 怎么样的：

1）创建一个序列从1开始的新列。
2）每行都有一个number 。
3）创建索引： number % 1000
4）查询number % 1000等于0到999之间的随机数的行（这应该命中索引并加载数据库的随机部分）
5）然后，您可以将RANDOM（）添加到ORDER BY子句中，然后它将对数据库的那个块进行排序，并且速度提高1,000倍。
6）然后选择这两行中的前两行。

如果这仍然不够随机（因为行将始终配对具有相同的“散列”），您可能可以执行两个随机行的并集，或者在查询中使用OR子句并生成两个随机密钥。

希望沿着这些方向的东西可以非常快速和随意地随机。

postgres：从表中获取随机条目 - 太慢了

问题描述

4 个解决方案

解决方案1
3 2011-11-28 18:12:56

解决方案2
1 2011-11-29 02:01:15

解决方案3
0 已采纳 2011-11-28 18:17:59

解决方案4
0 2011-11-28 19:02:14

postgres：从表中获取随机条目 - 太慢了

问题描述

4 个解决方案

解决方案1 3 2011-11-28 18:12:56

解决方案2 1 2011-11-29 02:01:15

解决方案3 0 已采纳 2011-11-28 18:17:59

解决方案4 0 2011-11-28 19:02:14

解决方案1
3 2011-11-28 18:12:56

解决方案2
1 2011-11-29 02:01:15

解决方案3
0 已采纳 2011-11-28 18:17:59

解决方案4
0 2011-11-28 19:02:14