[英]Calculating percentage change over row values while iterating through columns using lapply in R
我有一个数据框,其中包含大量变量的每周值。 我想遍历每一列并获得每行的每周变化和以百分比表示的变量。
例子:
a = c(2,3,1,9)
b = c(4,5,8,1)
sentiment = cbind(a,b) %>%
as.data.frame()`
Outcome should be:
a b a_delta b_delta
2 4 NA NA
3 5 0.5 0.3
1 8 -0.7 0.6
9 1 8.0 -0.8
在我目前的方法中,我使用两个步骤:(1) 创建每周滞后,(2) 计算滞后值和值之间的百分比差异。 没有错误消息,但计算仍然不正确,我不知道为什么。 任何帮助将非常感激!
library(data.table)
a = c(2,2.5,2,4)
b = c(4,5,8,1)
sentiment = cbind(a,b) %>%
as.data.frame()
setDT(sentiment)[, paste0(names(sentiment), "_delta") := lapply(.SD, function(x) shift(x, 1L,
type="lag")/x -1)]
这是一个基本的 R 解决方案,使用sapply
传入一个函数来lapply
使用setNames
迭代具有所需输出列名称的情绪列。
sentiment <- data.frame(a = c(2,3,1,9), b = c(4,5,8,1))
calc_lag <- function(x) {
c(NA, round(sapply(2:length(x), function(y) {
(x[y] - x[y-1]) / x[y-1]
}), 1))
}
cbind(sentiment, lapply(setNames(sentiment, paste0(colnames(sentiment), '_lag')), calc_lag))
# a b a_lag b_lag
#1 2 4 NA NA
#2 3 5 0.5 0.2
#3 1 8 -0.7 0.6
#4 9 1 8.0 -0.9
我们可以使用diff
library(dplyr)
sentiment %>%
mutate_all(list(delta = ~ round(c(NA, diff(.))/lag(.), 1)))
或者如果我们使用dplyr
的devel
版本
sentiment %>%
mutate(across(everything(), ~ round(c(NA, diff(.x))/lag(.x), 1),
names = "{col}_delta"))
# a b a_delta b_delta
#1 2 4 NA NA
#2 3 5 0.5 0.2
#3 1 8 -0.7 0.6
#4 9 1 8.0 -0.9
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.