繁体   English   中英

时间序列分类-如何使用来自多个位置的数据训练一个模型?

[英]Classification of time series - how to train one model using data from multiple location?

我有来自多个位置的天气传感器的数据源。 我正在尝试对是否发生某个事件进行分类(简单的二进制分类)。 我已标记数据(每个位置100万个样本-15分钟间隔)。

我假设我尝试分类的事件非常简单(许多模式在所有位置都以相同的方式发生)

我想为所有位置创建一个模型,但也希望能够概括要添加的下一个位置。

现在,我正在使用简单的BiLSTM网络,并且使用如下滚动窗口对数据进行预处理:

    def create_dataset(self, dataset, look_back=1):
     dataX, dataY = [], []
     for i in range(len(dataset) - look_back - 1):
         a = dataset[i:(i + look_back), :]
         dataX.append(a)
         dataY.append(dataset[i + look_back, 0])
     return np.array(dataX), np.array(dataY)

我的第一个想法是使用滚动窗口对每个位置进行预处理,将所有数据连接到一个训练集中,并在每个时期之前进行洗牌。

您认为这是一个好方法吗? 你能推荐一个更好的吗? 我想念什么吗?

提前致谢。

编辑:我不想在训练期间告诉我的模型确切的位置,因为将来当我想在一个新的位置预测事件时,当前的训练会偏向某个位置。

我假设您想让模型知道您要从哪个位置进行输入。 因此,您的输入必须以某种方式告诉您要从哪个位置发送数据。 您可以将数据的位置部分连接到实际的天气信息,或者使用更热的编码,例如x=temperature*e_(loc) ,其中e_(loc)=(0,0,1,0,...)的第三位置。 在后一种设置中,您还可以同时为系统提供多个温度(或其他信息)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM