簡體   English   中英

Lucene獲取最高頻率條款和原始文件

[英]Lucene Get Highest Frequency Terms and Origin Document

我已經通過Lucene 4.0.0實現了一個詞雲,調用方法getHighFreqTerms()如下

TermStats[] termStats = HighFreqTerms.getHighFreqTerms(ir, HITS, "content");

我正在嘗試找到一種方法來獲取每個術語的由來。 這可能嗎? 我需要做什么? 我想到了一個解決方案,即獲取每個文檔每個術語的頻率值,同時將術語和每個文檔的ArrayList值存儲在HashMap中,但是我堅信這效率低下。

你有什么建議嗎?

非常感謝你,

HighFreqTerms僅為您提供有關索引的信息。 如果需要文檔,則必須使用查詢。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM