簡體   English   中英

從索引分析器獲取標記並復制到字符串字段

[英]Get tokens from Index Analyzer and copy to string field

這個想法是我有一個帶有停用詞和小寫過濾器的索引分析器的 name_s (solr.TextField) 字段。 我想獲取索引分析器的 output 並作為單個字符串復制到字符串字段 name_x。 這可能嗎?

例子

Input for name_s: The red brown fox was actually black.
_____________________________________________
Index Analyzed for name_s:
red
brown
fox
black

_____________________________________________
Now input inside of name_x: red brown fox black

我不認為有一種方法可以准確地完成您正在嘗試做的事情(將單個令牌從一個字段保存到另一個字段),但是如果您只想檢查特定字段的處理方式,您可以作弊並使用方面獲取此信息。

例如,假設我有一個文本字段,其中包含關於 id 為“00000004”的文檔的以下信息:

"id":"00000004",
"title_txt_en":"Personal rights and the domestic relations /

然后我可以 output 存儲在title_txt_en中的單個令牌,通過使用這樣的查詢按此字段進行分面:

# q=id:00000004
# facet.field=title_txt_en
# f.title_txt_en.facet.mincount=1
curl http://localhost:8983/solr/your-core/select?f.title_txt_en.facet.mincount=1&facet.field=title_txt_en&facet=on&q=id%3A00000004

響應將包括以下內容:

"facet_counts":{
    "facet_queries":{},
    "facet_fields":{
      "title_txt_en":[
        "domest",1,
        "person",1,
        "relat",1,
        "right",1]}

您可以在其中看到被索引的各個標記:此記錄中此字段的“domest”、“person”、“relat”和“right”。

正如我所說,這不是您要尋找的確切答案,但希望它有所幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM