繁体 English 中英

大型多维数据的无监督聚类

[英]Unsupervised Clustering of large multi-dimentional data

原文 2021-08-19 11:55:06 5 1 python/ machine-learning/ cluster-analysis/ unsupervised-learning/ feature-clustering

您好，我是机器学习新手。 我需要一些关于高维数据无监督聚类的帮助。 我有超过 15 个维度的数据，大约有 50 - 8 万行。 数据看起来像这样（15 个参与者，每个参与者的行数几乎相等，并且有 15 个特征）-

参与者	时间	功能 1	功能 2...
1个	0.05	值	值
1个	0.10	值	值
2个	0.05	值	值
2个	0.10	值	值
2个	0.15	值	值

数据由许多参与者组成，每个参与者都有多行数据，并且他们的时间戳记有他们的特征。 我的目标是根据参与者对这些数据进行聚类，并根据这些聚类进行推断。 这里的问题是每个参与者都有很多行，我无法用一个点代表每个参与者，因此将它们聚类似乎是一项艰巨的任务。

我想帮助：

将这些数据聚类以便我可以根据参与者进行推断的最佳方法是什么？
我应该使用哪种聚类技术？ 我已经尝试过 sklearn 的 Kmeans、meanshift 和其他库，但它们花费的时间太长，导致我的系统崩溃。

对不起，如果它有点难以理解，我会尽力回答你的问题。 预先感谢您的帮助。 如果这个问题与其他问题非常相似，请告诉我（我找不到）。

谢谢你：）

1 个解决方案

由于您在必要的计算量方面遇到麻烦，因此您必须在这里做出某种妥协。 这里有一些可能会解决您的问题的建议，但它们都是有代价的。

降维即 PCA 将您的列数减少到 ~2 左右。 您将丢失一些信息，但您将能够 plot 它并通过 K-means 进行推理。
平均患者数据。 不确定这是否足够，这取决于您的数据。 这将失去对患者的超时观察，但可能会大大减少行数。

我的建议是进行降维，因为随着时间的推移丢失患者的数据可能会使您的数据变得无用。 除了 PCA 之外还有其他东西，例如自动编码器。 为了按照您的描述方式进行聚类，我建议您坚持使用 K-means 或软 K-means。

迭代多维数组

[英]Iterating over a multi-dimentional array

python列表能否将多维数组作为其元素？

[英]Can a python list hold a multi-dimentional array as its element?

需要更好的方法来排序和合并多维数组

[英]Need better way to sort&merge multi-dimentional array

如何在子数据帧上过滤多维数据帧

[英]how to filter multi-dimentional dataframe on sub dataframe

如何在多维数组上训练LSTM模型？

[英]How to train an LSTM model on multi-dimentional array?

如何在Python中返回两个多维列表的差异？

[英]How to return the difference of two multi-dimentional lists in Python?

将粒子群优化算法应用于多维搜索空间？

[英]applying the Particle swarm optimization algorithm into multi-dimentional searching space?

如何从多维数组中删除项目？

[英]How to remove an item from a multi-dimentional array?

在记住索引的同时遍历多维列表

[英]Iterating through multi-dimentional lists while remembering indices

需要在数组python3的多维列表中获取整个第一个元素（数组）

[英]need to grab entire first element (array) in a multi-dimentional list of arrays python3

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 迭代多维数组 python列表能否将多维数组作为其元素？需要更好的方法来排序和合并多维数组如何在子数据帧上过滤多维数据帧如何在多维数组上训练LSTM模型？如何在Python中返回两个多维列表的差异？将粒子群优化算法应用于多维搜索空间？如何从多维数组中删除项目？在记住索引的同时遍历多维列表需要在数组python3的多维列表中获取整个第一个元素（数组）

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM