繁体   English   中英

在数据框列表中应用滚动功能

[英]Apply rolling function across list of data frames

我有一个数据框列表,每个数据框对应一个日期,每个数据框的行对应一天中的小时时段。 我需要每天在等效的时间戳上应用滚动功能。

例如,对于一个滚动的5个周期的窗口,我想对每个01:00:00、02:00:00等应用一个函数,以此类推,滚动前5天的时间戳,直到end = length(list) -5 ,每个函数应用程序产生一个值。 结果将是每个length end时间戳的值向量。

我正在考虑创建一个新的数据帧列表,其中每个数据帧将与一个时间戳相对应,行与天相对应,在这种情况下,我想知道将当前数据帧列表转换为这种新格式的最佳方法。 但是,如果还有其他更有效的方法,我也欢迎其他建议。

编辑:我试图在下面包括示例数据集和结果,但是我不知道如何正确格式化数据

例如,如果列表包含具有以下格式的4个数据帧。 Col1是一个变量,而Col2是另一个变量

Date    Time    Col1    Col2
1   2014-08-12  09:00:00    -0.0001079389   0.0002159128
2   2014-08-12  09:30:00    -0.0002158895   0.0002159361
3   2014-08-12  10:00:00    -0.0001079739   0.0008642109
4   2014-08-12  10:30:00    -0.0003241666   0.0003242717
5   2014-08-12  11:00:00    -0.0006482282   0.0005405113
6   2014-08-12  11:30:00    -0.0010794474   0.0002160294
7   2014-08-12  12:00:00    -0.0002157963   0.0002158429
8   2014-08-12  12:30:00    -0.0001079040   0.0009716600
9   2014-08-12  13:00:00    -0.0005397528   0.0002159827
10  2014-08-12  13:30:00    0.0000000000    0.0005398111
11  2014-08-12  14:00:00    0.0000000000    0.0003238517
12  2014-08-12  14:30:00    -0.0002158895   0.0003239216
13  2014-08-12  15:00:00    -0.0002159128   0.0001079739
14  2014-08-12  15:30:00    0.0000000000    0.0008642109
15  2014-08-12  16:00:00    -0.0003240966   0.0004322922
16  2014-08-12  16:30:00    -0.0003241666   0.0003242717
17  2014-08-12  17:00:00    -0.0008642109   0.0001080789
18  2014-08-12  17:30:00    -0.0001079739   0.0004320121
19  2014-08-12  18:00:00    -0.0005396945   0.0001079739

如果函数的滚动窗口为2,则使用简单的函数(例如乘法),将前两个数据帧中的等效行相乘,向前滚动直到第3和第4个数据帧中的等效行相乘。

Res1 = data.frame(matrix(NA,ncol=3,nrow=19))
rownames(Res1) = Example[[1]][,2]
colnames(Res1) = c("2014-08-13","2014-08-14","2014-08-15")
Res1[,1]= Example[[1]][,3]*Example[[2]][,3]
Res1[,2]= Example[[2]][,3]*Example[[3]][,3]
Res1[,3]= Example[[3]][,3]*Example[[4]][,3]

这是一个简单的示例,因为我要应用的功能将一次向前滚动5个数据帧中的等效行。 下面,该函数仅应用于Col1变量以简化操作,但我将对所有变量单独进行此操作。

结果应类似于以下内容,其中第一列名称是每个滚动窗口的结尾,因此4个数据框(相当于4个日期)变为3列

row.names   2014-08-13  2014-08-14  2014-08-15
1   09:00:00    0.000000e+00    0.000000e+00    4.612407e-08
2   09:30:00    6.987091e-08    0.000000e+00    0.000000e+00
3   10:00:00    6.987846e-08    6.954805e-08    4.614140e-08
4   10:30:00    4.889919e-07    1.621737e-07    2.307567e-08
5   11:00:00    0.000000e+00    0.000000e+00    0.000000e+00
6   11:30:00    6.977682e-07    4.869397e-07    8.083873e-08
7   12:00:00    2.325015e-08    5.794719e-08    1.154280e-07
8   12:30:00    0.000000e+00    0.000000e+00    0.000000e+00
9   13:00:00    5.816615e-08    0.000000e+00    0.000000e+00
10  13:30:00    0.000000e+00    9.270554e-08    6.921964e-08
11  14:00:00    0.000000e+00    0.000000e+00    0.000000e+00
12  14:30:00    0.000000e+00    0.000000e+00    9.224832e-08
13  15:00:00    1.627863e-07    1.621387e-07    2.305836e-08
14  15:30:00    0.000000e+00    0.000000e+00    0.000000e+00
15  16:00:00    6.972068e-08    0.000000e+00    0.000000e+00
16  16:30:00    1.045980e-07    3.122420e-07    4.148280e-07
17  17:00:00    0.000000e+00    0.000000e+00    2.419698e-07
18  17:30:00    0.000000e+00    0.000000e+00    2.303854e-07
19  18:00:00    5.810978e-08    1.040920e-07    6.218404e-07

对于谁在这个环节发现自己的任何人,我发现我的答案在此链接

准确地讲,我执行了以下操作,之后您可以对新形成的数据应用滚动功能

DataSample = lapply(DataList, function(x) with(x,x[x$Col==Idx,,drop=FALSE]))

DataSample = data.frame(matrix(unlist(DataSample),nrow=noDays,byrow=T),stringsAsFactors=FALSE)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM