簡體   English   中英

R group_by%>%full_join丟失NA記錄

[英]R group_by %>% full_join losing NA records

考慮這兩個數據框:

t1<-data.frame(Time=1:3,Cat=rep("A",3),SomeValue=rep("t1",3))
t2<-data.frame(Time=c(1,2,3,1,3),Cat=rep("A",5),Id=c(1,1,1,2,2),SomeOtherValue=c(1,2,3,4,5))

在我的應用程序中,我需要進行完全連接並使用缺少的記錄/值。 在子集上進行部分full_join(分組var)有效,但是當我嘗試未經過濾的方法時,我丟失了我的缺失值。

這將給我6條記錄

t2 %>% group_by(Id) %>% filter(Id==2) %>%  full_join(t1,by=c("Time","Cat"))
t2 %>% group_by(Id) %>% filter(Id==1) %>%  full_join(t1,by=c("Time","Cat"))

這將給我5,其中Id == 2和Time == 2的缺失條目(NA值)消失了:

t2 %>% group_by(Id) %>% full_join(t1,by=c("Time","Cat"))

我對group_by的理解是它按變量分組,並繼續我在每個組上的所有后續變異,映射等。 它應該以這種方式表現嗎?

在正確閱讀文檔之后,我終於找到了一個部分,聲明為了加入而忽略了組。 ?FULL_JOIN

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM