簡體   English   中英

需要計算文檔中每個術語的頻率

[英]need to count the frequency of each terms inside a document

我需要計算文檔中所有術語的頻率。 我怎樣才能做到這一點 ? 我不要求代碼。 我只是在尋求指導。 實際上我在文檔和查詢之間進行一些相似度計算。 我已經計算了查詢的術語頻率。 但我不知道如何計算文檔中每個單詞的tern頻率。 誰能指導我? 感謝您的關注。

您可以使用HashMap,其中key是您的術語和值 - 它的頻率。 每當你看到你的術語,你就會增加價值。 文件完成后,你有你的號碼。

是的,使用HashMap保存值並瀏覽文件,您可以使用掃描儀

在Java中,你應該使用HashMap<String, Integer> 術語將是HashMap鍵,術語頻率是值。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM