繁体   English   中英

基于 R 中的另一个数据帧线性插值

[英]Linearly interpolate values based on another dataframe in R

我有两个数据框:

cash_flows

    coupon_date
1   2026-07-31   
2   2026-01-31    
3   2025-07-31     
4   2025-01-31    
5   2024-07-31    
6   2024-01-31    

discount_rates

  date        df 
1 2023-07-25  0.9806698 
2 2024-07-25  0.9737091 
3 2025-07-25  0.9432057 
4 2026-07-27  0.9109546 
5 2027-07-26  0.8780984 

我想在cash flows中创建一个新列,其中包含discount ratesdr列的线性插值。

因此,所需的输出是:

cash_flows

    coupon_dates  new_column
1   2026-07-31    0.910594
2   2026-01-31    0.926509
3   2025-07-31    0.942678
4   2025-01-31    0.957831
5   2024-07-31    0.973208
6   2024-01-31    0.977056

我已经下载了forecast包,但仍然不完全确定如何实现这一点。 任何帮助表示赞赏。

复制数据帧的代码:

cash_flows <- data.frame(coupon_date = as.Date(c("2026-07-31","2026-01-31","2025-07-31", "2024-07-31","2024-01-31")))
drdr <- data.frame(date = as.Date(c("2023-07-25","2024-07-25","2025-07-25", "2026-07-27","2027-07-26")), df = c(0.9806698, 0.9737091, 0.9432057, 0.9109546, 0.8780984))

这是一个选项。 我们将线性模型df ~ date拟合到drdr 然后使用predict来估计cash_flows中日期的df 请注意,这些数字与您的预期输入不完全匹配。

fit <- lm(df ~ date, data = drdr)
cash_flows %>%
    mutate(new_column = predict(fit, newdata = data.frame(date = coupon_date)))
#  coupon_date new_column
#1  2026-07-31  0.9101729
#2  2026-01-31  0.9234352
#3  2025-07-31  0.9369172
#4  2024-07-31  0.9636614
#5  2024-01-31  0.9769969

?approx可用于线性插值。
drdr数据传递源xy变量,并指定您想知道基于cash_flows$coupon_date x值 ( xout xout= ) 的插值输出y值:

cash_flows$new_column <- approx(x=drdr$date, y=drdr$df, xout=cash_flows$coupon_date)$y
cash_flows
#  coupon_date new_column
#1  2026-07-31  0.9105935
#2  2026-01-31  0.9265089
#3  2025-07-31  0.9426784
#4  2024-07-31  0.9732077
#5  2024-01-31  0.9770563

与您的预期输出完全匹配( cash_flows中的一行除外,它不在您的代码中以复制 data.frames,但在问题的前面显示)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM