[英]To check similarity between text data
請指導我如何測量用於聚類的文本數據的相似性,對於數值數據,我們可以使用歐氏距離測量或任何其他距離測量進行測量。 數據是從網站收集的用於搜索的關鍵字,第二個數據集是一些搜索返回的片段集合。 相似性也應該在含義上相似。
閱讀 tf-idf 和余弦相似度。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.