簡體   English   中英

如何為多種語言環境和內容類型構造Solr核心?

[英]How do I structure Solr cores for multiple locales and content types?

我希望運行Solr服務器,以統一公共網站多個不同方面的搜索。 首先,有幾種語言環境 (美國,愛爾蘭,日本等)和幾種類型的內容 (論壇,常規網頁,幫助頁面,產品等)。

我希望能夠對單個語言環境執行搜索,但是返回多種內容類型的結果,以便可以將它們顯示為選項卡式結果集。

可能的選擇:

  • 每個語言環境都有一個核心,並使用同一索引中的字段來區分內容類型。
  • 每種內容類型都有一個核心。
  • 每種內容類型/語言環境組合都有一個核心。
  • 單核/單索引適用於所有內容。

注意事項:

Solr Wiki提到,多核在大約1000萬個文檔中開始提供性能提升,而且我認為即使考慮到所有語言環境和內容類型,我們在此之下的表現也可能很好。 但是,僅將所有數據粉碎到一個索引中的解決方案似乎有點混亂,並且可能難以分片/擴展。 但是,單核非常適合獲得單個結果集,因為我從來不需要跨核進行多重搜索。

任何使用過多核的人都可以建議我嗎?

似乎對此問題有些興趣,所以我想我將開始根據自己的一些發現來更新答案。

首先,通過語言環境分隔核心有一些真正的優勢,因為它使每種語言都可以輕松擁有自己的停用詞和設置。 就我而言,我永遠不會跨語言環境搜索,因此這是合乎邏輯的。 另外,由於每個內核的索引大小較小,這可能會給我帶來一定的速度提高。

至於按核心划分內容類型,我仍在嘗試一種內容類型,因此在擴展時會進行更新。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM