[英]Elasticsearch: High CPU usage by Lucene Merge Thread
我有一个带有2个主节点和18个数据节点的ES 2.4.1群集,该群集收集每天创建的新索引的日志数据。 一天之内,索引大小会增长到大约2TB。 超过7天的索引将被删除。 在群集上执行的搜索很少,因此主要目标是提高索引吞吐量。
我看到以下许多异常,这是我接下来要说的另一种症状:
EsRejectedExecutionException[rejected execution of org.elasticsearch.transport.TransportService$4@5a7d8a24 on EsThreadPoolExecutor[bulk, queue capacity = 50, org.elasticsearch.common.util.concurrent.EsThreadPoolExecutor@5f9ef44f[Running, pool size = 8, active threads = 8, queued tasks = 50, completed tasks = 68888704]]];]];
群集中的节点一直在固定CPU。 我将索引刷新间隔增加到30s,但是效果不大。 当我检查热线程时,使用100%CPU的每个节点会看到多个“ Lucene合并线程”。 我还注意到,每个分片的段数一直在1000左右,这似乎很多。 以下是细分统计信息的示例:
"_2zo5": {
"generation": 139541,
"num_docs": 5206661,
"deleted_docs": 123023,
"size_in_bytes": 5423948035,
"memory_in_bytes": 7393758,
"committed": true,
"search": true,
"version": "5.5.2",
"compound": false
}
极高的“世代”数量令我担心,我想优化段创建并合并以减少节点上的CPU负载。
有关索引和集群配置的详细信息:
最好的方法是什么?
谢谢!
这是我对集群进行的优化,以增加索引吞吐量:
希望这对别人有帮助
我已经完成了类似的工作量,并且最好的选择是每小时运行一次索引,并对较旧的索引进行优化以保持细分的状态。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.