[英]Interpolate missing values of column based on values of another dataframe
[英]Linearly interpolate values based on another dataframe in R
我有两个数据框:
cash_flows
coupon_date
1 2026-07-31
2 2026-01-31
3 2025-07-31
4 2025-01-31
5 2024-07-31
6 2024-01-31
discount_rates
date df
1 2023-07-25 0.9806698
2 2024-07-25 0.9737091
3 2025-07-25 0.9432057
4 2026-07-27 0.9109546
5 2027-07-26 0.8780984
我想在cash flows
中创建一个新列,其中包含discount rates
中dr
列的线性插值。
因此,所需的输出是:
cash_flows
coupon_dates new_column
1 2026-07-31 0.910594
2 2026-01-31 0.926509
3 2025-07-31 0.942678
4 2025-01-31 0.957831
5 2024-07-31 0.973208
6 2024-01-31 0.977056
我已经下载了forecast
包,但仍然不完全确定如何实现这一点。 任何帮助表示赞赏。
复制数据帧的代码:
cash_flows <- data.frame(coupon_date = as.Date(c("2026-07-31","2026-01-31","2025-07-31", "2024-07-31","2024-01-31")))
drdr <- data.frame(date = as.Date(c("2023-07-25","2024-07-25","2025-07-25", "2026-07-27","2027-07-26")), df = c(0.9806698, 0.9737091, 0.9432057, 0.9109546, 0.8780984))
这是一个选项。 我们将线性模型df ~ date
拟合到drdr
。 然后使用predict
来估计cash_flows
中日期的df
。 请注意,这些数字与您的预期输入不完全匹配。
fit <- lm(df ~ date, data = drdr)
cash_flows %>%
mutate(new_column = predict(fit, newdata = data.frame(date = coupon_date)))
# coupon_date new_column
#1 2026-07-31 0.9101729
#2 2026-01-31 0.9234352
#3 2025-07-31 0.9369172
#4 2024-07-31 0.9636614
#5 2024-01-31 0.9769969
?approx
可用于线性插值。
从drdr
数据传递源x
和y
变量,并指定您想知道基于cash_flows$coupon_date
x
值 ( xout xout=
) 的插值输出y
值:
cash_flows$new_column <- approx(x=drdr$date, y=drdr$df, xout=cash_flows$coupon_date)$y
cash_flows
# coupon_date new_column
#1 2026-07-31 0.9105935
#2 2026-01-31 0.9265089
#3 2025-07-31 0.9426784
#4 2024-07-31 0.9732077
#5 2024-01-31 0.9770563
与您的预期输出完全匹配( cash_flows
中的一行除外,它不在您的代码中以复制 data.frames,但在问题的前面显示)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.