Solr（黑點）查詢，帶連字符和停用詞

Question

我在Solr 1.4.1中使用Ruby Sunspot gem

我在搜索連字符時遇到問題。

當我搜索“ foo bar bla”時，將返回預期結果。

如果在搜索字詞中包含連字符（如“ foo-bar bla”），則不會返回結果。

在過去的幾天中，我已將連字符添加到停用詞列表中，並以多種方式調整了schema.xml文件，但無濟於事。

對於那些接觸過太陽黑子的人，我的最小字匹配設置為3，這與在solrconfig.xml文件中設置相同的mm配置相同，例如：3

這就是我的schema.xml文件的相關部分的外觀。

    <!-- *** This fieldType is used by Sunspot! *** -->
<fieldType name="string" class="solr.StrField" tokenized="true" omitNorms="true" sortMissingLast="true">
  <analyzer type="query">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.ASCIIFoldingFilterFactory"/>
    <filter class="solr.StandardFilterFactory"/>
    <filter class="solr.LowerCaseFilterFactory"/>
    <filter class="solr.PorterStemFilterFactory"/>
    <filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
  </analyzer>
  <analyzer type="index">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.ASCIIFoldingFilterFactory"/>
    <filter class="solr.StandardFilterFactory"/>
    <filter class="solr.LowerCaseFilterFactory"/>
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false" />
    <filter class="solr.PorterStemFilterFactory"/>
    <filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
    <filter class="solr.EdgeNGramFilterFactory" minGramSize="3" maxGramSize="15" side="front"/>
  </analyzer>
</fieldType>

<!-- *** This fieldType is used by Sunspot! *** -->
<fieldType name="text" class="solr.TextField" omitNorms="false">
  <analyzer type="query">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.ASCIIFoldingFilterFactory"/>
    <filter class="solr.StandardFilterFactory"/>
    <filter class="solr.LowerCaseFilterFactory"/>
    <filter class="solr.PorterStemFilterFactory"/>
    <filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
  </analyzer>
  <analyzer type="index">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.ASCIIFoldingFilterFactory"/>
    <filter class="solr.StandardFilterFactory"/>
    <filter class="solr.LowerCaseFilterFactory"/>
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false" />
    <filter class="solr.PorterStemFilterFactory"/>
    <filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
    <filter class="solr.EdgeNGramFilterFactory" minGramSize="3" maxGramSize="15" side="front"/>
  </analyzer>
</fieldType>

任何幫助或建議，將不勝感激。

謝謝，

Answer 1

連字符（-）是Solr運算符，用於排除與運算符后面的單詞匹配的結果。 我認為在停用詞列表中添加連字符不會對此產生影響。 我建議在通過Solr運行查詢之前刪除連字符。 我的猜測是，連字符的結果排除了與“ bar”匹配的文檔？ 也許您可以嘗試對結果進行分面，以查看是否確實如此。

Solr（黑點）查詢，帶連字符和停用詞

問題描述

1 個解決方案

解決方案1
6 已采納 2012-03-12 00:33:41

Solr（黑點）查詢，帶連字符和停用詞

問題描述

1 個解決方案

解決方案1 6 已采納 2012-03-12 00:33:41

解決方案1
6 已采納 2012-03-12 00:33:41