標簽[spherical-kmeans] - 堆棧內存溢出

[英]Calculating Cosine Similarity in Julia for K-Means

我正在 Julia 中實現 K-means 聚類。找出並實現 k-means 的修改，它可以通過向量之間的角度來測量相似度。所以我假設可以為此使用余弦相似度，我通過計算歐幾里得距離的平方，使代碼與常規 K-means 一起工作：我試圖通過使用余弦相似度來做到這一點，例如：但這似乎不起作用。 ...

使用 TENSORFLOW2 的 Kmeans 聚類

[英]Kmeans clustering using TENSORFLOW2

如何將包含 47 列和 99999 行的 Pandas 數據庫轉換為 Tensorflow 2 中的張量？ Kmeans 算法是否已經在 TF 2 下實現了？因為命令tf.contrib.factorization.KMeans在 TF2 下不起作用，因為tf.contrib在第二個 API T ...

如何使用Python將“文本文檔”與“球形k均值”聚類？

[英]How to cluster “text document” with “spherical k-means” using Python?

我已經完成了傳統的k均值文本聚類。但是，現在，我需要將程序修改為“球形k均值文本聚類”，但尚未成功。我已經在網站上搜索了解決方案，但是仍然無法成功修改我的程序。以下是對我的項目應有幫助的資源，但我仍然找不到解決方法。 https://github.com/jaso ...

根據客戶視圖創建產品聚類

[英]Create product clustering based on customer views

我有 100 萬行是這樣的： customer_id product_id_viewed 12345 [756436, 369955, 1244356, 4689667] 我想根據客戶查看模式的聚合將通常一起查看的產品聚集到單獨的集群中。我怎么做？我采取的另一個步驟是將這些數據加載到 E ...

張量流kmeans似乎沒有新的初始點

[英]tensorflow kmeans doesn't seem to take new initial points

通過在Tensorflow上獲得許多k均值試驗的平均距離最小的結果，我在數據中找到了最佳聚類。但是我的代碼不會在每次試用中都更新初始質心，因此所有結果都是相同的。這是我的代碼1-tensor_kmeans.py 這是code1之外的代碼。在哪里可以找到問題？ ...

K-Means ++算法-解釋下一個集群中心的選擇

[英]The K-Means++ Algorithm - Explain the Choice of the Next Cluster Center

就像圖片一樣，為什么不只選擇點2作為聚類的第二個點呢？而是去生成一個隨機數bettwen [0,1]？為什么生成r與p（圖片中的累計概率為Sum）進行比較？ ...

k = 2的Kmeans算法給出相同的簇大小輸出

[英]Kmeans algorithm for k=2 which gives equal cluster size outputs

我正在使用改良的勞埃德（Lloyd）算法，以k = 2的kmeans獲得相等的簇大小輸出。以下是偽代碼：現在上述算法憑經驗對我來說很好用：它提供了平衡的群集總是降低目標以前是否有文獻提出或分析過這種算法？我可以得到一些參考嗎？ ...

opencv：如何使用 kmeans() 按角度進行聚類

[英]opencv: how to clusterize by angle using kmeans()

問題是，如何按角度對某些單位進行聚類？問題在於，kmeans 基於歐幾里得空間距離的概念運行，並且不知道角度的周期性。因此，要使其工作，需要將角度轉換為歐幾里得空間，但要保持以下正確：近角是歐幾里得空間中的近值；遠角在歐幾里得空間中很遠。這意味着，90 和 -90 是遠值，1 ...