[英]Keep indices in a scatter plot of jaccard distance matrix
我有一个距离矩阵,我想将其绘制为2D散点图。
我已经找到了通过sklearn.manifold的方法:
mds = MDS(n_components=2, dissimilarity='precomputed')
X_r = mds.fit(jac_sim).embedding_
plt.figure()
plt.scatter(X_r[:,0],X_r[:,1],c="red")
plt.savefig((args.Directory + "/MDS2.svg"), format = "svg")
我想携带距离矩阵中的列或索引的名称,以便我可以按Indiv编号对图中的点进行颜色编码,并可以放置标签。 我试图检查X_r文件,但它仅包含散点图的坐标,而没有原点的信息。
如何按列/索引名称对代码进行颜色编码?
如果您知道jac_sim
的大小不会改变,那么您始终知道jac_sim
编号在哪里,因此您可以使用不同的数据切片进行两次散布:
mds = MDS(n_components=2, dissimilarity='precomputed')
X_r = mds.fit(jac_sim).embedding_
plt.figure()
plt.scatter(X_r[:3:,0],X_r[:3:,1],c="red")
plt.scatter(X_r[3::,0],X_r[3::,1],c="blue")
plt.savefig((args.Directory + "/MDS2.svg"), format = "svg")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.