簡體   English   中英

如何計算散點圖中每個簇的距離 plot

[英]How to calculate the distance of each cluster in a scatter plot

我在散點圖 plot 中繪制了 2 個集群,我需要找到它們的標准偏差和從一個集群到另一個集群的中心距離。 我找不到任何文檔指南來簡化為散點圖查找 2 個集群的中心的過程,原因是我需要將每個集群的散布與集群中心的距離進行比較。 我的實際散點圖 plot 如下所示:

import matplotlib.pyplot as plt
import numpy as np


vector1 = [
    2.8238, 
    3.0284, 
    5.9333,
    2.0156,
    2.2467, 
    2.0092,
    4.7983, 
    4.3554,
    3.6372, 
    1.3159, 
    2.6174, 
    2.2336, 
    0.9625, 
    5.6285, 
    5.4040, 
    2.7887, 
    0, 
    3.4632, 
    0, 
    2.7370
]  
vector5 = [
    1.2994, 
    7.4469,
    3.6503, 
    2.1667,
    4.1975, 
    3.3006, 
    10.4082, 
    3.4112, 
    2.2395, 
    1.5653, 
    4.3237, 
    1.8679, 
    1.2622, 
    14.1372, 
    6.1686, 
    3.8903, 
    2.2873, 
    6.2559, 
    0.2132, 
    7.2303,
]

plt.rcParams['figure.figsize'] = (16.0, 10.0)
plt.style.use('ggplot')
data = [vector1, std_colomns4]

plt.plot(vector1 , marker='.', linestyle='none', markersize=20, label='Vector 1')
plt.plot(vector5, marker='.', linestyle='none', markersize=20, label='Vector 5')


plt.xticks(range(1, 20, 1))
plt.yticks(range(1, 20, 1))
plt.ylabel('Sizes')
plt.xlabel('Index')
plt.legend()
plt.show()

為了預可視化:

在此處輸入圖像描述

您可以通過將它們轉換為 arrays 來計算平均值

vector1 = np.array([...])
vector5 = np.array([...])

mean1 = np.mean(vector1)
mean5 = np.mean(vector5)

# Rest of the code

plt.plot((vector1+vector5)/2, marker='x', linestyle='none', markersize=12, label='Mean')

plt.axhline(mean1)
plt.axhline(mean5, c='b')

在此處輸入圖像描述

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM