[英]Apply rolling function which generates a list of data.frames (or single rbinded data.frame)
[英]Apply rolling function across list of data frames
我有一个数据框列表,每个数据框对应一个日期,每个数据框的行对应一天中的小时时段。 我需要每天在等效的时间戳上应用滚动功能。
例如,对于一个滚动的5个周期的窗口,我想对每个01:00:00、02:00:00等应用一个函数,以此类推,滚动前5天的时间戳,直到end = length(list) -5 ,每个函数应用程序产生一个值。 结果将是每个length end时间戳的值向量。
我正在考虑创建一个新的数据帧列表,其中每个数据帧将与一个时间戳相对应,行与天相对应,在这种情况下,我想知道将当前数据帧列表转换为这种新格式的最佳方法。 但是,如果还有其他更有效的方法,我也欢迎其他建议。
编辑:我试图在下面包括示例数据集和结果,但是我不知道如何正确格式化数据
例如,如果列表包含具有以下格式的4个数据帧。 Col1是一个变量,而Col2是另一个变量
Date Time Col1 Col2
1 2014-08-12 09:00:00 -0.0001079389 0.0002159128
2 2014-08-12 09:30:00 -0.0002158895 0.0002159361
3 2014-08-12 10:00:00 -0.0001079739 0.0008642109
4 2014-08-12 10:30:00 -0.0003241666 0.0003242717
5 2014-08-12 11:00:00 -0.0006482282 0.0005405113
6 2014-08-12 11:30:00 -0.0010794474 0.0002160294
7 2014-08-12 12:00:00 -0.0002157963 0.0002158429
8 2014-08-12 12:30:00 -0.0001079040 0.0009716600
9 2014-08-12 13:00:00 -0.0005397528 0.0002159827
10 2014-08-12 13:30:00 0.0000000000 0.0005398111
11 2014-08-12 14:00:00 0.0000000000 0.0003238517
12 2014-08-12 14:30:00 -0.0002158895 0.0003239216
13 2014-08-12 15:00:00 -0.0002159128 0.0001079739
14 2014-08-12 15:30:00 0.0000000000 0.0008642109
15 2014-08-12 16:00:00 -0.0003240966 0.0004322922
16 2014-08-12 16:30:00 -0.0003241666 0.0003242717
17 2014-08-12 17:00:00 -0.0008642109 0.0001080789
18 2014-08-12 17:30:00 -0.0001079739 0.0004320121
19 2014-08-12 18:00:00 -0.0005396945 0.0001079739
如果函数的滚动窗口为2,则使用简单的函数(例如乘法),将前两个数据帧中的等效行相乘,向前滚动直到第3和第4个数据帧中的等效行相乘。
Res1 = data.frame(matrix(NA,ncol=3,nrow=19))
rownames(Res1) = Example[[1]][,2]
colnames(Res1) = c("2014-08-13","2014-08-14","2014-08-15")
Res1[,1]= Example[[1]][,3]*Example[[2]][,3]
Res1[,2]= Example[[2]][,3]*Example[[3]][,3]
Res1[,3]= Example[[3]][,3]*Example[[4]][,3]
这是一个简单的示例,因为我要应用的功能将一次向前滚动5个数据帧中的等效行。 下面,该函数仅应用于Col1变量以简化操作,但我将对所有变量单独进行此操作。
结果应类似于以下内容,其中第一列名称是每个滚动窗口的结尾,因此4个数据框(相当于4个日期)变为3列
row.names 2014-08-13 2014-08-14 2014-08-15
1 09:00:00 0.000000e+00 0.000000e+00 4.612407e-08
2 09:30:00 6.987091e-08 0.000000e+00 0.000000e+00
3 10:00:00 6.987846e-08 6.954805e-08 4.614140e-08
4 10:30:00 4.889919e-07 1.621737e-07 2.307567e-08
5 11:00:00 0.000000e+00 0.000000e+00 0.000000e+00
6 11:30:00 6.977682e-07 4.869397e-07 8.083873e-08
7 12:00:00 2.325015e-08 5.794719e-08 1.154280e-07
8 12:30:00 0.000000e+00 0.000000e+00 0.000000e+00
9 13:00:00 5.816615e-08 0.000000e+00 0.000000e+00
10 13:30:00 0.000000e+00 9.270554e-08 6.921964e-08
11 14:00:00 0.000000e+00 0.000000e+00 0.000000e+00
12 14:30:00 0.000000e+00 0.000000e+00 9.224832e-08
13 15:00:00 1.627863e-07 1.621387e-07 2.305836e-08
14 15:30:00 0.000000e+00 0.000000e+00 0.000000e+00
15 16:00:00 6.972068e-08 0.000000e+00 0.000000e+00
16 16:30:00 1.045980e-07 3.122420e-07 4.148280e-07
17 17:00:00 0.000000e+00 0.000000e+00 2.419698e-07
18 17:30:00 0.000000e+00 0.000000e+00 2.303854e-07
19 18:00:00 5.810978e-08 1.040920e-07 6.218404e-07
对于谁在这个环节发现自己的任何人,我发现我的答案在此链接
准确地讲,我执行了以下操作,之后您可以对新形成的数据应用滚动功能
DataSample = lapply(DataList, function(x) with(x,x[x$Col==Idx,,drop=FALSE]))
DataSample = data.frame(matrix(unlist(DataSample),nrow=noDays,byrow=T),stringsAsFactors=FALSE)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.