[英]Elastic search index for Ngram?
說我有一句話, This is a new city
這取決於您的令牌生成器 。 默認情況下,Elasticsearch使用Standant Tokenizer ,它divides text into terms on word boundaries, as defined by the Unicode Text Segmentation algorithm.
, divides text into terms on word boundaries, as defined by the Unicode Text Segmentation algorithm.
這意味着您的句子將被標記為this, is, a, new, city
。 您可以根據需要創建自定義標記器。
當您將文檔放入Elasticsearch時對其進行索引。
數據保存在文件系統中: https : //www.elastic.co/blog/found-dive-into-elasticsearch-storage
這是有關內部構件的博客文章: https : //www.elastic.co/blog/found-elasticsearch-from-the-bottom-up
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.