簡體   English   中英

更新Solr 6.6.0中字段的配置

[英]Update the configuration of a field in Solr 6.6.0

我正在使用Apache Solr 6.6.0,以便通過遞歸索引文件夾中的所有文件來構建搜索引擎。

我的操作如下:1)我基於雲示例創建索引。 2)我索引給定文件夾中的所有文件。

bin\solr start -e cloud -noprompt
java -Dc=gettingstarted -Dauto=yes -Ddata=files -Drecursive=yes -jar example\exampledocs\post.jar <path_to_folder>

稍后,當我在用戶界面中搜索查詢時,我看到,即使它為我提供了最匹配的內容,也沒有為我提供文檔內容。 經過一番研究,我在托管模式文件中找到了一個名為“ _text_”的字段及其配置:

<field name="_text_" type="text_general" multiValued="true" indexed="true" stored="false"/>

如您所見,該字段未存儲,我認為這是響應未提供內容的原因。

我在正確的軌道上嗎? 如果是這樣,我如何編輯該字段的配置? 我應該刪除它並創建一個具有相同名稱且具有storage = true的新文件嗎?

謝謝。

不應將_text_字段存儲,因為它用作“全部捕獲”字段。 因此,首先,您應該檢查Solr配置,以確保它僅包含文件內容。 如果是這樣,則可以將該字段標記為已存儲。

但是,通常來說,文件內容僅被索引而不被存儲,因為

  • 為了讓最終用戶看到內容,GUI具有其他訪問文件內容的方式(例如,通常將諸如txt文件之類的靜態資源發布在單獨的Apache實例中,因此從客戶端的角度來看,這只是問題HTTP URL)
  • 它會大大增加您的索引大小

因此,換句話說:使用Solr進行搜索,一旦獲得給定的項目元數據,就可以使用其標識符進入其他系統並“查看”相應的內容。 這是通常的情況,尤其是處理txt文件等非結構化數據時

  • “通常”並不意味着它總是有效的。 在某些情況下,您可能希望Solr做到這一點,或者總的來說,可能會有其他一些很好的理由將字段標記為已存儲(例如,突出顯示)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM