Elasticsearch：使用带有切片的滚动 api 时为空切片

Question

我有一个简单的设置，其中包含 1 个实例的绿色集群（v7.5.2）和 1 个索引（副本 0）和 8 个分片。 索引了 61,500 个文档。

如果我使用这些查询创建 8 个切片（POST 查询）

http://localhost:9202/products_dev/_search?scroll=10m: {'slice': {'field': 'created_at', 'id': 0, 'max': 8}, 'size': 1000}
http://localhost:9202/products_dev/_search?scroll=10m: {'slice': {'field': 'created_at', 'id': 1, 'max': 8}, 'size': 1000}
...
http://localhost:9202/products_dev/_search?scroll=10m: {'slice': {'field': 'created_at', 'id': 7, 'max': 8}, 'size': 1000}

对于每个切片，我收集每个切片的第一个命中并获得这些长度： [1000, 0, 0, 0, 0, 0, 0, 0]

只有 1 个切片有结果，这相当于首先不切片索引。

我用这些命令最多尝试了 32 个：

http://localhost:9202/products_dev/_search?scroll=10m: {'slice': {'field': 'created_at', 'id': 0, 'max': 32}, 'size': 1000}
http://localhost:9202/products_dev/_search?scroll=10m: {'slice': {'field': 'created_at', 'id': 1, 'max': 32}, 'size': 1000}
...
http://localhost:9202/products_dev/_search?scroll=10m: {'slice': {'field': 'created_at', 'id': 31, 'max': 32}, 'size': 1000}

对于每个切片，我收集每个切片的第一个命中并获得这些长度： [1000, 0, 0, 0, 0, 0, 0, 0, 1000, 0, 0, 0, 0, 0, 0, 0, 1000, 0, 0, 0, 0, 0, 0, 0, 1000, 0, 0, 0, 0, 0, 0, 0]

这样我可以使用 4 个不同的（非空）切片滚动我的索引，但我必须创建 32 个不理想的上下文。

我究竟做错了什么？

我尝试使用日期作为 slice.field

"slice": {
        "field": "created_at",

但它没有帮助。

Answer 1

我的本地索引文件很少，大部分文件保存在 1 个分片中

Elasticsearch：使用带有切片的滚动 api 时为空切片

问题描述

1 个解决方案

解决方案1
0 2020-07-09 12:01:40

Elasticsearch：使用带有切片的滚动 api 时为空切片

问题描述

1 个解决方案

解决方案1 0 2020-07-09 12:01:40

解决方案1
0 2020-07-09 12:01:40