簡體   English   中英

ElasticSearch 切片滾動限制(python)

[英]ElasticSearch sliced scroll limit (python)

我正在使用一個巨大的(500 萬個文檔)ElasticSearch 數據庫,我需要在 python 中使用切片滾動來獲取數據。 問題是:是否有某種方法可以限制(設置size參數)切片滾動? 我試圖通過[search obj].param(size=500000)[:500000]設置size參數,但它似乎不起作用 - 切片滾動給了我所有的文件。

在我的腳本中,我將切片滾動與 python 多處理一起使用,如下所示: https : //github.com/elastic/elasticsearch-dsl-py/issues/817

有沒有辦法使用切片滾動獲取例如 500000 個文檔?

提前致謝。

來自 github 的回答:

“滾動沒有限制,它總是返回所有文檔。要僅獲取一個子集,只需在使用 break 語句或類似語句獲取要檢索的數字后停止使用迭代器。”

https://github.com/elastic/elasticsearch-dsl-py/issues/817

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM