簡體   English   中英

Django Haystack子串搜索

[英]Django Haystack substring search

我最近在我的django支持的網站上添加了搜索功能,允許雇主使用關鍵字搜索員工。 當用戶最初上傳他們的簡歷時,我將其轉換為文本,刪除停用詞,然后將文本添加到該用戶的TextField。 我使用了Django-Haystack和Whoosh搜索引擎。

三件事-

1)除了我可能不會使用的額外功能之外,切換到Solr或Xapian有什么具體的優勢嗎?

2)在將簡歷變成文本時,我基本上將自己編入索引。 我知道Xapian和Solr都支持.pdf索引,但是,從它的外觀來看,Haystack沒有。 關於如何解決這個問題的任何提示? 或者我應該自己編制索引嗎? 如果是這樣,我應該做的不僅僅是提供關鍵字的文本文件嗎?

3)如果關鍵字與其自身完全匹配,則Whoosh僅返回結果。 如果用戶將“數學”作為他的關鍵詞,並且我搜索“數學”,我希望該用戶出現。 我無法明確告訴Xapian或Solr是否支持這一點。 思考?

謝謝你的任何建議。 我將暫時繼續深入研究這個問題。

不幸的是,我不知道回答你的其他問題,但是對於第3點。)哎呀其實支持這個。

您必須使用SearchQuerySet的自動完成功能。

詳細信息請訪問: http//docs.haystacksearch.org/dev/autocomplete.html

我目前正在使用Whoosh並在部分比賽中匹配。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM