簡體   English   中英

有沒有更有效的方法來計算 R 中的月份差異

[英]Is there a more efficient way to calculate the difference in months in R

我在面板結構中有一個大數據框(201720 行;3 列),如下所示:

Name <- c("A", "A", "A", "B", "B", "B")

Inception <- c(as.Date("2007-12-31"), as.Date("2007-12-31"), as.Date("2007-12-31"),
               as.Date("1990-12-31"), as.Date("1990-12-31"), as.Date("1990-12-31"))
 
Months <- c(as.Date("2010-01-01"), as.Date("2010-02-01"), as.Date("2010-03-01"),
            as.Date("2010-01-01"), as.Date("2010-02-01"), as.Date("2010-03-01"))

df <- data.frame(Name, Inception, Months)

我想為每一行計算 «Inception» 和 «Months» 的月份差異,並將其分配給名為 «Age» 的新列。 如果結果為負,則應填寫 NA。 我想出了以下解決方案並且有效。 但是,它的計算速度不是很快。

for (i in 1:nrow(df)){
  if(df[i,2]>df[i,3]){
    df[i,"Age"] <- NA
  } else {
    df[i,"Age"] <- interval(df[i,2],
                            df[i,3]) %/% months(1)
  }
}

有沒有更有效的方法來計算這種差異?

我們可以使用case_when

library(dplyr)
library(lubridate)
df <- df %>% 
  mutate(Age = case_when(Inception <= Months
     ~ interval(Inception, Months) %/% months(1)))

-輸出

df
Name  Inception     Months Age
1    A 2007-12-31 2010-01-01  24
2    A 2007-12-31 2010-02-01  25
3    A 2007-12-31 2010-03-01  26
4    B 1990-12-31 2010-01-01 228
5    B 1990-12-31 2010-02-01 229
6    B 1990-12-31 2010-03-01 230

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM