繁体 English 中英

DBSCAN集群集群（sklearn python）

[英]DBSCAN clusters of cluster (sklearn python)

原文 2015-06-24 14:50:49 3 2 python/ scikit-learn/ cluster-computing/ dbscan

我有不同类别的元素，需要分别进行聚类（根据其类别），然后再进行聚类。 每个元素都有一个位置（纬度，经度）。

我的目标是确定群集（同一类别中不同元素的组）的群集（不同类别的组），如下图所示： http : //i.imgur.com/V5Dovcf.png

在我的情况下，应包含在一个群集中的两个元素之间的距离与两个群集中的群集之间的距离相同。 例如，在带有蓝色簇的图片中。 由于此蓝色群集中的所有元素（与群集中的任何元素）最多相距d距离，因此它们属于蓝色群集。 对于红色簇，其中包含最多相距d的元素的情况相同

如果我提供所有元素在一起作为输入，那么使用DBSCAN可以轻松找到所有这些元素的簇。 而且，如果我想查找每个类别的集群，那么我将不得不仅提供不同类别的输入作为输入，并逐一运行DBSCAN。 但是我想应该有比运行多次DBSCAN更快的速度来获取这些群集集群

2 个解决方案

您为什么认为混合要分开的类别会更快？

首先执行廉价操作，例如拆分数据集。 然后独立处理每个分区。

据我所知，科学不能加快大地测量的距离。 因此，您将必须执行O（n ^ 2）距离计算。 如果您有10个类别，则可以将其分成这样的分区并运行10次DBSCAN，则问题的速度会提高 10倍，因为每次运行的费用要便宜10 ^ 2倍！

在我看来，这里的主要问题是由于数据的多重表示或分层性质（类别中的类别和群集）所致。 通常，如果距离基于奇异维度，则可以将这两个维度（例如，簇距离和类别距离）合并在一起以形成新的奇异维度，从而使数据表示变得更简单。

也许这可以帮助？

我发现一些有用的材料：

本论文
本论文工作

python / sklearn-在执行kmeans之后如何获取集群和集群名称

[英]python/sklearn - how to get clusters and cluster names after doing kmeans

python - 意外的 sklearn dbscan 结果

[英]python - unexpected sklearn dbscan result

sklearn DBSCAN将具有大epsilon的GPS位置聚类

[英]sklearn DBSCAN to cluster GPS positions with big epsilon

sklearn.cluster.DBSCAN提供意外结果

[英]sklearn.cluster.DBSCAN gives unexpected result

在python中绘制sklearn集群

[英]Plot the sklearn clusters in python

DBSCAN 聚类 Python - 聚类词

[英]DBSCAN Clustering Python - cluster words

在python中的sklearn中绘制DBSCAN中的特定点

[英]Plot specific points in DBSCAN in sklearn in python

如何定义sklearn.cluster.DBSCAN的eps参数的值范围？

[英]How to define a range of values for the eps parameter of sklearn.cluster.DBSCAN?

ImportError：dbscan示例中没有名为sklearn.cluster的模块

[英]ImportError: No module named sklearn.cluster in dbscan example

如何在sklearn.cluster DBSCAN中分配sample_weights？

[英]How to assign sample_weights in sklearn.cluster DBSCAN?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 python / sklearn-在执行kmeans之后如何获取集群和集群名称 python - 意外的 sklearn dbscan 结果 sklearn DBSCAN将具有大epsilon的GPS位置聚类 sklearn.cluster.DBSCAN提供意外结果在python中绘制sklearn集群 DBSCAN 聚类 Python - 聚类词在python中的sklearn中绘制DBSCAN中的特定点如何定义sklearn.cluster.DBSCAN的eps参数的值范围？ ImportError：dbscan示例中没有名为sklearn.cluster的模块如何在sklearn.cluster DBSCAN中分配sample_weights？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM