![](/img/trans.png)
[英]When using ElasticSearch Scroll API, how to optimize the time parameter in situ?
[英]Elasticsearch: empty slices when using scroll api with slice
我有一个简单的设置,其中包含 1 个实例的绿色集群(v7.5.2)和 1 个索引(副本 0)和 8 个分片。 索引了 61,500 个文档。
如果我使用这些查询创建 8 个切片(POST 查询)
http://localhost:9202/products_dev/_search?scroll=10m: {'slice': {'field': 'created_at', 'id': 0, 'max': 8}, 'size': 1000}
http://localhost:9202/products_dev/_search?scroll=10m: {'slice': {'field': 'created_at', 'id': 1, 'max': 8}, 'size': 1000}
...
http://localhost:9202/products_dev/_search?scroll=10m: {'slice': {'field': 'created_at', 'id': 7, 'max': 8}, 'size': 1000}
对于每个切片,我收集每个切片的第一个命中并获得这些长度: [1000, 0, 0, 0, 0, 0, 0, 0]
只有 1 个切片有结果,这相当于首先不切片索引。
我用这些命令最多尝试了 32 个:
http://localhost:9202/products_dev/_search?scroll=10m: {'slice': {'field': 'created_at', 'id': 0, 'max': 32}, 'size': 1000}
http://localhost:9202/products_dev/_search?scroll=10m: {'slice': {'field': 'created_at', 'id': 1, 'max': 32}, 'size': 1000}
...
http://localhost:9202/products_dev/_search?scroll=10m: {'slice': {'field': 'created_at', 'id': 31, 'max': 32}, 'size': 1000}
对于每个切片,我收集每个切片的第一个命中并获得这些长度: [1000, 0, 0, 0, 0, 0, 0, 0, 1000, 0, 0, 0, 0, 0, 0, 0, 1000, 0, 0, 0, 0, 0, 0, 0, 1000, 0, 0, 0, 0, 0, 0, 0]
这样我可以使用 4 个不同的(非空)切片滚动我的索引,但我必须创建 32 个不理想的上下文。
我究竟做错了什么?
我尝试使用日期作为 slice.field
"slice": {
"field": "created_at",
但它没有帮助。
我的本地索引文件很少,大部分文件保存在 1 个分片中
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.