[英]need to count the frequency of each terms inside a document
我需要計算文檔中所有術語的頻率。 我怎樣才能做到這一點 ? 我不要求代碼。 我只是在尋求指導。 實際上我在文檔和查詢之間進行一些相似度計算。 我已經計算了查詢的術語頻率。 但我不知道如何計算文檔中每個單詞的tern頻率。 誰能指導我? 感謝您的關注。
您可以使用HashMap,其中key是您的術語和值 - 它的頻率。 每當你看到你的術語,你就會增加價值。 文件完成后,你有你的號碼。
是的,使用HashMap保存值並瀏覽文件,您可以使用掃描儀
在Java中,你應該使用HashMap<String, Integer>
。 術語將是HashMap鍵,術語頻率是值。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.