簡體 English 中英

AWS Elasticsearch批量插入延遲急劇增加

[英]AWS Elasticsearch Bulk Insert Latency Increased drastically

原文 2019-09-04 23:50:17 7 1 python/ amazon-web-services/ elasticsearch

我在t2.small節點和10gb EBS卷上使用AWS Elasticsearch。 每隔5分鍾，我會索引約5000個文檔*。 對於每個文檔，我都手動傳遞唯一ID。 由於大多數文檔都已更新，因此對於幾乎所有文檔而言，版本都可能是2或3 。

還值得一提的是，每天我都會執行delete_by_query操作來刪除超過一周的文檔。

通常，批量插入的等待時間小於1秒。 但是今天突然間，經過短短幾個小時的兩周測試，延遲延長到3分鍾，以便批量插入5000個文檔 。

我正在使用elasticsearch-py和awsauth。

我檢查了AWS Cluster運行狀況統計信息。 自從出現了大容量插入延遲問題以來，舊垃圾回收時間似乎急劇增加。 似乎這些之間可能存在關聯。

該如何處理？ 是因為維護文檔的多個版本還是使用查詢刪除功能？

1 個解決方案

這並不特別令人驚訝，但是僅由於變量太多，很難為您提供完整的答案。 要考慮的一些事情：

為文檔重新索引非常昂貴，因為它首先涉及刪除
隨着索引變大，執行段合並的開銷也會增加
隨着索引變大，維護文檔值和全局序號變得越來越昂貴
您正在可爆t2實例上運行，因此可能會用光CPU或IO積分
您不會提及進行優化/強制合並，如果您有很多已刪除/過時的文檔，這可能會有所幫助

Elasticsearch批量插入失敗時回滾

[英]Rollback on elasticsearch bulk insert failure

在Amazon Elasticsearch Service上建立索引 - 批量插入

[英]Indexing on Amazon Elasticsearch Service - Bulk Insert

在python的Elasticsearch中批量插入時出現連接錯誤

[英]Connection Error while bulk insert in elasticsearch in python

在 Elasticsearch 中插入多個文檔 - 批量文檔格式化程序

[英]Insert multiple documents in Elasticsearch - bulk doc formatter

如何在 Elasticsearch 中批量插入忽略過程中可能發生的所有錯誤？

[英]How to bulk Insert in Elasticsearch ignoring all errors that may occur in the process?

如何將已創建的json格式字符串插入Elasticsearch Bulk

[英]How to insert an already created json-format string to Elasticsearch Bulk

Elasticsearch 散裝插入帶 Python - 套接字超時錯誤

[英]Elasticsearch Bulk insert w/ Python - socket timeout error

將 JSON 數組插入 Elasticsearch 使用 Python 批量 API

[英]Insert JSON Array into Elasticsearch Using Python Bulk API

使用Python的Elasticsearch批量響應

[英]Elasticsearch Bulk Response with Python

在 Python 中使用 Elasticsearch 進行批量更新

[英]Bulk Update with Elasticsearch in Python

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Elasticsearch批量插入失敗時回滾在Amazon Elasticsearch Service上建立索引 - 批量插入在python的Elasticsearch中批量插入時出現連接錯誤在 Elasticsearch 中插入多個文檔 - 批量文檔格式化程序如何在 Elasticsearch 中批量插入忽略過程中可能發生的所有錯誤？如何將已創建的json格式字符串插入Elasticsearch Bulk Elasticsearch 散裝插入帶 Python - 套接字超時錯誤將 JSON 數組插入 Elasticsearch 使用 Python 批量 API 使用Python的Elasticsearch批量響應在 Python 中使用 Elasticsearch 進行批量更新

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM