從多個文檔中添加詞頻 (Solr)

Question

您如何使用 Solr 數學運算或函數查詢為查詢返回的所有文檔添加每個單詞的詞頻 (tf) 值？

我知道有一些方法可以使用 java 迭代添加術語向量，但是如果索引很大或內存有限，這可能需要很長時間。 Solr 有原始詞頻值和添加普通字段值的能力，所以我認為它應該能夠添加詞頻，我只是不知道如何。

還有，我不知道提前是什么詞，每個文檔可以有任意的詞組合。

對於此文檔結果：

"docs": [
  {
    "id": 0,
    "content": [
      "FOO FOO BAR"
    ],
  },
  {
    "id": 0,
    "content": [
      "FOO BAR"
    ],
  },
]},"termVectors": [
"uniqueKeyFieldName",
[
  "0",
  [
    "FOO",
    [
      "tf",
      2
    ],
    "BAR",
    [
      "tf",
      1
    ],
],"1",
  [
    "FOO",
    [
      "tf",
      1
    ],
    "BAR",
    [
      "tf",
      1]]}

我想要這樣的東西：

{"frequencies":{
"FOO" : 3
"BAR" : 2
}

更新：我現在可以使用 Java 的編程方法，因為我認為 SOLR 不支持這樣的開箱即用的操作。

Answer 1

totaltermfreq或ttf提供術語在索引中出現的總次數。

Answer 2

您是否已經考慮過“ 方面 ”功能？

Answer 3

你檢查過統計組件嗎？ 可以將動態字段定義為stats.field 。 請參閱Solr 統計組件示例中的stats.field={!func}termfreq('text','memory') ：

http://localhost:8983/solr/techproducts/select?q=*:*&wt=xml&stats=true&stats.field={!func}termfreq('text','memory')&stats.field=price&stats.field=popularity&rows=0&indent=true

從多個文檔中添加詞頻 (Solr)

問題描述

3 個解決方案

解決方案1
0 2015-01-09 23:09:50

解決方案2
0 2015-01-11 04:34:14

解決方案3
0 2021-12-21 07:05:36

從多個文檔中添加詞頻 (Solr)

問題描述

3 個解決方案

解決方案1 0 2015-01-09 23:09:50

解決方案2 0 2015-01-11 04:34:14

解決方案3 0 2021-12-21 07:05:36

解決方案1
0 2015-01-09 23:09:50

解決方案2
0 2015-01-11 04:34:14

解決方案3
0 2021-12-21 07:05:36