[英]python supervised learning with data set classification
我是深度学习的新手,目前正在研究某个主题。 我正在寻找时间序列模式中异常的机器学习检测及其在 python 中的实现。
例如,我在某个时间间隔内记录了我的计算机的不同 CPU 频率。 我想实现一个监督学习算法,它以 CPU 频率的时间序列作为输入,并决定在那段时间是否发生任何“不寻常”的事情(不寻常的 CPU 使用率等)。
编辑:
我的数据集如下所示,每 10 秒测量一次当前 CPU 频率。 我没有指定每组数据点的确切数量,以下仅用于说明。 但我预计每组大约有 2500 个数据点:
数据集_1:{1.2、1.2、1.6、1.3、1.5、1.7、1.6、1.4、1.5} -> Label:“好”
数据集_2:{1.3、1.2、1.4、1.3、1.4、1.5、1.9、2.1、2.0} -> Label:“好”
数据集_n:{1.3、1.2、3.6、3.5、1.4、1.5、3.3、3.2、1.2} -> Label:“坏”
我对监督机器学习算法的理解是我有训练数据集。 但是,到目前为止,我发现的每个教程总是标记数据集中的每个值。 在我的情况下这是不可能的,因为我只能告诉我的 ML 算法:
a) 这个时间序列数据集是正常的
b) 在这个数据集中有些东西是不正常的
但我不能 label 每个单独的值,这意味着我不能说:
1.2 -> 好
1.3 -> 不好
1.4 -> 好
由于有许多不同的 ML 算法,初学者很难确定哪个是好的。 所以我的问题是:
我可以使用哪种(python 实现)算法作为开始,它接受整个数据集的标签,并且不希望每个值都被标记。
我希望这个问题是有道理的,非常欢迎编辑和您的时间一样! 谢谢!
对于这个应用程序,我将 go 与 KNN(K - 最近邻)。 Tech with Tim 有一个很棒的关于 KNN 的教程,很好地解释了它并展示了实现。 希望这可以帮助
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.