繁体   English   中英

ElasticSearch中的“ from”参数是否会影响ElasticSearch集群?

[英]Does “from” parameter in ElasticSearch Impact the ElasticSearch Cluster?

我有大量的索引类型的文档(大约34719074个文档)(ES 2.4.4)。 在搜索过程中,当“ from”参数很高(大于100000,“ size”参数不变)时,我的ES群集似乎影响很大(搜索延迟,CPU使用率,JVM内存和平均负载)。 有什么具体原因吗? 我的查询看起来像:

 {
         "explain": false,
         "size": 100,
          "from": <>,
            "_source": {
                "excludes": [],
                "includes": [
                    <around 850 fields> 
                ]
            },
            "sort": [
            <sorting from an string field>
            ]
}

这是深度分页的经典问题。 您可以在Elasticsearch中阅读有关分页的链接。 从本质上讲,在跳过100000个文档后获取下一组文档将是一项内存密集型任务,因为要获得100000+个文档的结果集,需要从每个分片中提取100000+个文档,然后进行处理(排序,排序等)。 对较小的结果集进行排名/排序所花的时间要比对较大的结果集进行排序所花费的时间少。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM