[英]How to include missing observations in R data frame with time dimension based on a priori info?
我有一個不平衡的面板數據,我想對其進行處理以在其中包含一些先驗信息。 為此,我需要進行一些以數據幀時間維度為條件的數據操作。 原始數據如下所示:
FIRM_ID YEAR CAP_START CAP_END
OBS1 1 2000 CAP_S_2000 CAP_E_2000
OBS2 1 2001 CAP_S_2001 CAP_E_2001
OBS3 1 2002 NA NA
我知道OBS3行的CAP_START等於上一年的CAP_END。 如何在數據中包含先驗信息?
如果您的數據已經排序(最好是character
格式, factor
可能會導致級別問題),那么您可以使用類似以下內容的數據
#add preceding row cap_end entry:
dt$prev_CAP_END <- c(NA,head(dt$CAP_END,-1))
#wherever missing, update with prevcap_end
dt[which(is.na(dt$CAP_START)),"CAP_START"] <- dt[which(is.na(dt$CAP_START)),"prev_CAP_END"]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.