繁体   English   中英

在R包“ plyr”中使用ddply创建新列

[英]Creating a new column using ddply in the R package “plyr”

我正在研究动物跟踪数据集,并且需要为每个人计算每个GPS位置的时间戳之间的时间差。 为了简单起见,我的数据看起来像这样(现在暂时忘记其他变量):

ID  Time
B1  6:57
B1  6:59
B1  7:03
B1  7:10
B2  6:34
B2  6:45
B2  6:47
B2  6:48
B3  6:23
B3  6:35
B3  6:46
B3  6:47

我尝试使用以下方法计算时差:

ddply(df, "ID",transform,timediff=diff(Time))

但是我收到此错误消息:

data.frame中的错误(list(ID = c(1L,1L,1L,1L),时间= 8:11):
参数暗示不同的行数:4,3

我认为问题是每个动物的第一行都没有值。 有没有解决的办法? 任何帮助深表感谢。

您可以使用data.table

 library(data.table)

# create a lag variable of time by ID
setDT(data)[, timediff:=c(NA, Time[-.N]), by=ID]

dt
#>     ID Time timediff
#>  1: B1 6:57       NA
#>  2: B1 6:59        8
#>  3: B1 7:03        9
#>  4: B1 7:10       10
#>  5: B2 6:34       NA
#>  6: B2 6:45        2
#>  7: B2 6:47        4
#>  8: B2 6:48        6
#>  9: B3 6:23       NA
#>  10: B3 6:35       1
#>  11: B3 6:46       3
#>  12: B3 6:47       5

我们可以从base R使用ave

 df1$timediff <- with(df1, ave(as.numeric(Time), ID, FUN = function(x) c(NA, diff(x))))

假设“时间”属于日期时间类。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM