簡體   English   中英

Sphinx搜索最佳匹配結果

[英]Sphinx search best matching result

我在我的項目之一中使用了獅身人面像搜索。 我需要使搜索更准確。 例如,我的搜索是“我的Wordpress網站需要一名設計師和seo”。 所以我想要的是獲得最佳匹配的結果,其中包含設計師,seo和wordpress。 這是我的代碼

 $cl = new SphinxClient();
 $cl->SetServer('1.23.4', 456);
 $cl->SetMaxQueryTime(15000);
 $cl->SetMatchMode(SPH_SORT_RELEVANCE);
 $s->setMatchMode(SPH_MATCH_ANY);
 $s->SetLimits(0, 100);
 $res = $cl->query($searchterm,"products");

請幫幫我,謝謝

排名不是“魔術”-獅身人面像遵循一個精確的公式。 但是,其主觀要使用什么公式,每個應用程序都是不同的,並且將從不同的設置中受益。

在您的示例中,幾乎可以肯定的是,您的查詢中包含“常見”字詞。 例如,無論其他單詞是否匹配,所有包含“和”的文檔都將匹配!

停用詞是一種處理方式(但有時有時很簡單),基本上,您將所有常用詞添加到停用列表中,然后在匹配過程中不使用它們。

設置字段權重也可能確實有幫助,因為例如在標題中使用“常用”字詞不太可能(而全文可能會負擔很多)

或有定額運算符,因此可能需要一定數量的單詞(與停用詞結合使用或單獨使用!),例如,可能需要至少60%的單詞。 而不只是其中之一。

除了停用詞外,還可以虛擬地實現它,即預過濾查詢並刪除常用詞。

(停用詞或常用詞通常會根據您的特定索引手動創建。索引器內置了一個工具,可以從索引中提取常用詞,可以用作起點)

同樣,只要切換到SPH_MATCH_EXTENDED(可以通過使用定額運算符來保持“ OR”行為),您就可以靈活地選擇排名模式(setRankingMode),這為調整排名提供了更多可能性。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM