簡體   English   中英

關於FTS露天查詢中的PATH

[英]About PATH in FTS alfresco queries

我正在使用Alfresco 4.1.6和SOLR 1.4。

對於搜索,我使用fts_alfresco_language和searchService.query方法。

在查詢中,我按PATH,TYPE和一些自定義屬性(如路線,電話,郵件或類似名稱)進行搜索。

我現在有超過200萬個文檔,我們可以看到搜索的性能比開始時要差。

我讀到在Solr 1.4版中,在查詢中使用PATH是一個壞主意。 並且最好避免使用它,而僅使用TYPE以及屬性鍵和值。

但是我有兩個問題...

  1. 為什么PATH會增加響應時間? 這沒有幫助嗎? 我在存儲庫的根目錄中有1000多個主文件夾。 如果我指定solr可以搜索的文件夾,為什么不選擇結果而不是不搜索結果呢? 還是有另一種說法說solr主文件夾以減少結果,然后執行其余查詢?

  2. 當我通過自定義屬性查找時,我使用3或4個均已索引的屬性進行搜索。 這些合並的查找的開銷比一個更高? 也許只按一個屬性而不是三個屬性進行搜索會更好? 還是使用OR而不是AND來快速生成結果? SOLR如何工作?

謝謝!

首先讓我開始,我不確定您想要這個問題是什么,因為它含糊不清。 您不是在問如何使查詢更好,而是在問為什么不良習慣對您不利。

對如何構建ECM系統進行一些研究,首先要使ECM發揮任何作用的是適當的內容模型。 有書籍可以為您提供幫助。

如果您要使用文件夾(路徑)來構造內容,而這些對您來說很重要,那么您就需要將它們作為元數據添加到內容中。 如果您還沒有這樣做,那么您應該從此開始。

一個好的內容模型將能夠找到放置在ECM系統中任何位置的內容。 當然,將文件系統遷移到ECM系統並將其保留在那里很容易,但是您僅完成了一半的工作。

通常,路徑查詢很慢,因為它使用循環模式並且很昂貴。 在新的SOLR中,它已經得到了很大的改進,但是仍然不如普通的元數據查詢那樣快。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM