簡體   English   中英

如何計算Excel表格中2000個位置坐標或歐幾里得距離的數據的Silhoutte分數

[英]How to calculate Silhoutte score for the data in excel sheet which are 2000 location coordinates or Eucledian distance

如何計算excel表中2000個位置坐標或歐幾里得距離的數據的Silhoutte分數。 我需要根據 silhoutte 方法的結果使用 k 均值算法進行聚類。

假設您正在處理iris數據集(由於您尚未添加數據樣本)。 SKlearn庫提供了一種使用不同方法對集群進行聚類和評估的簡單方法。 其中之一是silhouette_score ,你可以在這里閱讀它。 實現將類似於以下內容:

from sklearn import datasets
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
#
# Load IRIS dataset
#
iris = datasets.load_iris()
X = iris.data
y = iris.target
#
# Instantiate the KMeans models
#
km = KMeans(n_clusters=3, random_state=42)
#
# Fit the KMeans model
#
km.fit_predict(X)
#
# Calculate Silhoutte Score
#
score = silhouette_score(X, km.labels_, metric='euclidean')
#
# Print the score
#
print('Silhouetter Score: %.3f' % score)

輸出:

Silhouetter Score: 0.553

此外,您可以在此處使用有關“在 KMeans 聚類上使用輪廓分析選擇聚類數量”的精彩教程。 歡迎來到 SO:P

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM