如何使用 python 客戶端獲取 elasticsearch 索引下的所有文檔？

Question

我正在嘗試使用 python 客戶端獲取所有索引文檔，但結果只顯示第一個文檔這是我的 python 代碼：

res = es.search(index="92c603b3-8173-4d7a-9aca-f8c115ff5a18", doc_type="doc", body = {
'size' : 10000,
'query': {
    'match_all' : {}
}
})
print("%d documents found" % res['hits']['total'])
data = [doc for doc in res['hits']['hits']]
for doc in data:
    print(doc)
    return "%s %s %s" % (doc['_id'], doc['_source']['0'], doc['_source']['5'])

Answer 1

Elasticsearch 默認只檢索 10 個文檔。 您可以在此處更改此行為 - doc 。 分頁的最佳實踐是search after query和scroll query 。 這取決於您的需求。 請閱讀此答案彈性搜索不提供大數字的頁面大小數據

要顯示所有結果：

for doc in res['hits']['hits']:
    print doc['_id'], doc['_source']

Answer 2

嘗試“_doc”而不是“doc”

res = es.search(index="92c603b3-8173-4d7a-9aca-f8c115ff5a18", doc_type="_doc", body = {
'size' : 100,
'query': {
    'match_all' : {}
}
})

Answer 3

您可以嘗試以下查詢。 它將返回所有文件。

result = es.search(index="index_name", body={"query":{"match_all":{}}})

Answer 4

您還可以使用elasticsearch_dsl及其搜索 API，它允許您通過scan方法迭代所有文檔。

import elasticsearch
from elasticsearch_dsl import Search

client = elasticsearch.Elasticsearch()
search = Search(using=client, index="92c603b3-8173-4d7a-9aca-f8c115ff5a18")

for hit in search.scan():
    print(hit)

Answer 5

我沒有看到提到如果您剛剛添加數據就必須刷新索引。 用這個：

es.indices.refresh(index="index_name")

如何使用 python 客戶端獲取 elasticsearch 索引下的所有文檔？

問題描述

5 個解決方案

解決方案1
4 2018-05-07 08:55:38

解決方案2
3 2020-11-15 17:40:12

解決方案3
0 2021-03-03 16:10:55

解決方案4
0 2021-06-19 10:15:56

解決方案5
0 2022-10-01 03:31:16

如何使用 python 客戶端獲取 elasticsearch 索引下的所有文檔？

問題描述

5 個解決方案

解決方案1 4 2018-05-07 08:55:38

解決方案2 3 2020-11-15 17:40:12

解決方案3 0 2021-03-03 16:10:55

解決方案4 0 2021-06-19 10:15:56

解決方案5 0 2022-10-01 03:31:16

解決方案1
4 2018-05-07 08:55:38

解決方案2
3 2020-11-15 17:40:12

解決方案3
0 2021-03-03 16:10:55

解決方案4
0 2021-06-19 10:15:56

解決方案5
0 2022-10-01 03:31:16