簡體   English   中英

Ngram的彈性搜索索引?

[英]Elastic search index for Ngram?

說我有一句話, This is a new city

  1. 彈性搜索是否為單詞的所有可能排列/組合創建索引。 例如,單詞“ city”會創建索引“ it”,“ ty”,“ ity”,“ cit”等嗎?
  2. 這些索引是在文檔存儲時還是在運行時創建的?
  3. 這些索引是保存在內存中還是數據庫中?
  1. 這取決於您的令牌生成器 默認情況下,Elasticsearch使用Standant Tokenizer ,它divides text into terms on word boundaries, as defined by the Unicode Text Segmentation algorithm.divides text into terms on word boundaries, as defined by the Unicode Text Segmentation algorithm. 這意味着您的句子將被標記為this, is, a, new, city 您可以根據需要創建自定義標記器。

  2. 當您將文檔放入Elasticsearch時對其進行索引。

  3. 數據保存在文件系統中: https : //www.elastic.co/blog/found-dive-into-elasticsearch-storage

這是有關內部構件的博客文章: https : //www.elastic.co/blog/found-elasticsearch-from-the-bottom-up

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM