[英]What considerations should I take into account when increasing the size in the Scroll API in Elasticsearch?
我目前正在使用Elasticsearch的Scroll API ,並希望使用它來獲取大量數據並對其進行一些手動處理。 該處理由外部庫執行,並且不屬於可以輕易包含為腳本的類型 。
盡管目前看來這很好,但是我想知道在微調滾動尺寸以執行這種形式的處理時應考慮哪些注意事項。 快速觀察似乎表明增加滾動大小將減少操作的等待時間。 盡管我懷疑較大的滾動條通常會降低吞吐量,但我不知道這種假設是否正確。 另外,我不知道是否有其他后果我現在沒有想到。
因此,總而言之,我的問題是:在為獲得的每個批次處理結果的情況下,更改Elasticsearch的滾動大小會產生什么影響,特別是對性能有何影響?
提前致謝!
一個(也是我唯一知道的)考慮因素是能夠足夠快地處理批處理,而不會釋放滾動上下文(由?scroll=X
參數控制)。
假設您將使用查詢中的所有數據,則應根據網絡和第三方應用程序的性能來調整滾動。 即
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.