繁体   English   中英

python 监督学习与数据集分类

[英]python supervised learning with data set classification

我是深度学习的新手,目前正在研究某个主题。 我正在寻找时间序列模式中异常的机器学习检测及其在 python 中的实现。

例如,我在某个时间间隔内记录了我的计算机的不同 CPU 频率。 我想实现一个监督学习算法,它以 CPU 频率的时间序列作为输入,并决定在那段时间是否发生任何“不寻常”的事情(不寻常的 CPU 使用率等)。

编辑:

我的数据集如下所示,每 10 秒测量一次当前 CPU 频率。 我没有指定每组数据点的确切数量,以下仅用于说明。 但我预计每组大约有 2500 个数据点:

数据集_1:{1.2、1.2、1.6、1.3、1.5、1.7、1.6、1.4、1.5} -> Label:“好”

数据集_2:{1.3、1.2、1.4、1.3、1.4、1.5、1.9、2.1、2.0} -> Label:“好”

数据集_n:{1.3、1.2、3.6、3.5、1.4、1.5、3.3、3.2、1.2} -> Label:“坏”

我对监督机器学习算法的理解是我有训练数据集。 但是,到目前为止,我发现的每个教程总是标记数据集中的每个值。 在我的情况下这是不可能的,因为我只能告诉我的 ML 算法:

a) 这个时间序列数据集是正常的

b) 在这个数据集中有些东西是不正常的

但我不能 label 每个单独的值,这意味着我不能说:

1.2 -> 好

1.3 -> 不好

1.4 -> 好

由于有许多不同的 ML 算法,初学者很难确定哪个是好的。 所以我的问题是:

我可以使用哪种(python 实现)算法作为开始,它接受整个数据集的标签,并且不希望每个值都被标记。

我希望这个问题是有道理的,非常欢迎编辑和您的时间一样! 谢谢!

对于这个应用程序,我将 go 与 KNN(K - 最近邻)。 Tech with Tim 有一个很棒的关于 KNN 的教程,很好地解释了它并展示了实现。 希望这可以帮助

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM