將數據框的一行中的NA替換為另一行中的值

Question

我想用另一行中的值替換一行中的NA，示例數據為：

group <-c('A','A_old')
year1<- c(NA,'20')
year2<- c(NA,'40')
year3<- c('20','230')
datac=data_frame(group,year1,year2,year3)

group <-c('A','A_old')
year1<- c('20','20')
year2<- c('40','40')
year3<- c('20','230')
finaldatac=data_frame(group,year1,year2,year3)

原始表要大得多，因此無法一一引用每個元素，也無法分配值。

謝謝！

為了下面的討論，由於原始表很大，我需要用它們的名稱來引用行值，並且我不能只玩兩行。 例如在下表中，我想用第5行（group == E）替換第1行（group == A）。 數據在這里：

group <-c('A','B','C','D','E','F','G')
year1<- c(NA,'100',NA,'200','300',NA,NA)
year2<- c(NA,'100',NA,'200','300','50','40')
year3<- c('20','100',10,'200','300','150','230')
data=data.frame(group,year1,year2,year3)

所以我想得到：

group <-c('A','B','C','D','E','F','G')
year1<- c('300','100',NA,'200','300',NA,NA)
year2<- c('300','100',NA,'200','300','50','40')
year3<- c('20','100',10,'200','300','150','230')
data=data.frame(group,year1,year2,year3)

Answer 1

除了使用fill或na.locf ，您還可以執行以下操作：

datac %>%
  group_by(grp = gsub("_.*", "", group)) %>%
  mutate_at(vars(contains("year")),
                 funs(.[!is.na(.)])) %>%
  ungroup() %>% select(-grp)

輸出：

# A tibble: 2 x 4
  group year1 year2 year3
  <chr> <chr> <chr> <chr>
1 A     20    40    20   
2 A_old 20    40    230

對於第二個示例，您可以執行以下操作：

data %>%
  mutate_at(
    vars(contains("year")), 
    funs(
      case_when(
        group == "A" & is.na(.) ~ .[group == "E"],
        TRUE ~ .)
      )
    )

輸出：

  group year1 year2 year3
1     A   300   300    20
2     B   100   100   100
3     C  <NA>  <NA>    10
4     D   200   200   200
5     E   300   300   300
6     F  <NA>    50   150
7     G  <NA>    40   230

您還可以在case_when添加其他條件。

例如，如果您還想用D組的內容替換C年，則可以添加：

data %>%
  mutate_at(
    vars(contains("year")), 
    funs(
      case_when(
        group == "A" & is.na(.) ~ .[group == "E"],
        group == "C" & is.na(.) ~ .[group == "D"],
        TRUE ~ .)
    )
  )

Answer 2

經過一個很長的夜晚，ri的頭痛使這個問題得以解決：

rm(list = ls())
group <-c('A','A old')
year1<- c(NA,'20')
year2<- c(NA,'40')
year3<- c('20','230')
datac=data_frame(group,year1,year2,year3)
group <-c('A','A old')
year1<- c('20','20')
year2<- c('40','40')
year3<- c('20','230')
finaldatac=data_frame(group,year1,year2,year3)


datac$group <- gsub(' ', '--', datac$group)
datact = t(datac)
colnames(datact) = datact[1, ] 
datact = datact[-1, ] 

datact[,"A"]  <- ifelse(!is.na(datact[,"A"]), datact[,"A"] , datact[,"A--old"])
datactt=t(datact)
group = rownames(datactt)
datactt<-cbind(datactt, group)
rownames(datactt) <- c()
datactt <- as.data.frame(datactt)

sapply(datactt, class)
datactt <- data.frame(lapply(datactt, as.character), stringsAsFactors=FALSE)


datactt$group <- gsub('--', ' ', datactt$group)

在哪里datactt（希望）與我想要的finaldatac相同...我確信這不是最好的解決方案，顯然不是最漂亮的解決方案。 如果有人有類似的東西，但更短或更有效，請發布它，我將不勝感激。

將數據框的一行中的NA替換為另一行中的值

問題描述

2 個解決方案

解決方案1
1 已采納 2019-01-27 20:35:12

解決方案2
0 2019-01-27 21:53:25

將數據框的一行中的NA替換為另一行中的值

問題描述

2 個解決方案

解決方案1 1 已采納 2019-01-27 20:35:12

解決方案2 0 2019-01-27 21:53:25

解決方案1
1 已采納 2019-01-27 20:35:12

解決方案2
0 2019-01-27 21:53:25