繁体   English   中英

要预测罕见事件分类,有没有比使用 LSTM Keras 更“简单”的方法?

[英]To predict rare event classification, is there any "more simple" way than using LSTM Keras?

我目前正在研究罕见事件预测,这是我以前从未做过的(我曾经处理过简单的预测问题),我查阅了这篇关于使用 LSTM 进行时间序列罕见事件分类的文章。

读起来非常令人兴奋,因为我认为我的案例有点相似:预测奶牛的产犊时间,具有历史活动特征,产犊仅在数据收集结束时发生一次。

然而......除了我的数据比示例小得多,我使用 LSTM 时遇到了太多的困惑。 我期待的关于 LSTM 的好处是“回顾”功能,它可以让你决定每个输出在你回顾之前的时间有多少输入。

我的问题是:是否有任何“更简单”或更简单的机器学习方法可以像 LSTM 那样用于时间序列分类?

我尝试使用简单的机器学习,例如决策树、随机森林,但我认为它不能很好地代表问题(将许多历史数据合并为一个输出)。

这个问题也在 StackExchange 上交叉发布。 我知道我应该在这里询问更多与编程相关的问题,但感谢任何帮助/见解。

许多机器学习项目/程序的问题是缺乏数据,您已经说过这是您不希望使用 LSTM 的原因之一。 不仅对于 LSTM(尽管这些也受到很大影响),但其他方法会遇到问题,例如过度拟合数据,对异常值的重视程度更高等,这些问题实际上只能通过更多数据来解决(或微调参数)。

您可以考虑的一个选项是合成数据生成,或者是一种不同的方法来扩展您的数据集。 这样你仍然可以使用 LSTM,因为它有更多的数据可以运行。

我将链接到一篇我发现有助于解决小数据问题的文章 最好的办法是采用简单的,或者说是基本的 ML 方法(线性回归就是一个例子)。

如果您想尝试将罕见的预测与更标准的模式分开(对您的数据集了解不多,很难说),您可以尝试的一种选择是 SVM。

如果你想挑出方差,即罕见的预测,你也可以尝试使用 PCA 并查看最大方差在哪里。

同样,我建议的方法在很大程度上取决于您的数据集,我不确定它们对您的时间序列数据的效果如何。 找到一种扩大数据集的方法将是更好的选择。

让我知道这是否有帮助!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM