[英]R group_by %>% full_join losing NA records
考慮這兩個數據框:
t1<-data.frame(Time=1:3,Cat=rep("A",3),SomeValue=rep("t1",3))
t2<-data.frame(Time=c(1,2,3,1,3),Cat=rep("A",5),Id=c(1,1,1,2,2),SomeOtherValue=c(1,2,3,4,5))
在我的應用程序中,我需要進行完全連接並使用缺少的記錄/值。 在子集上進行部分full_join(分組var)有效,但是當我嘗試未經過濾的方法時,我丟失了我的缺失值。
這將給我6條記錄
t2 %>% group_by(Id) %>% filter(Id==2) %>% full_join(t1,by=c("Time","Cat"))
t2 %>% group_by(Id) %>% filter(Id==1) %>% full_join(t1,by=c("Time","Cat"))
這將給我5,其中Id == 2和Time == 2的缺失條目(NA值)消失了:
t2 %>% group_by(Id) %>% full_join(t1,by=c("Time","Cat"))
我對group_by的理解是它按變量分組,並繼續我在每個組上的所有后續變異,映射等。 它應該以這種方式表現嗎?
在正確閱讀文檔之后,我終於找到了一個部分,聲明為了加入而忽略了組。 ?FULL_JOIN
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.