簡體   English   中英

檢查文本數據之間的相似性

[英]To check similarity between text data

請指導我如何測量用於聚類的文本數據的相似性,對於數值數據,我們可以使用歐氏距離測量或任何其他距離測量進行測量。 數據是從網站收集的用於搜索的關鍵字,第二個數據集是一些搜索返回的片段集合。 相似性也應該在含義上相似。

閱讀 tf-idf 和余弦相似度。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM