用下一列 (R) 中的變量替換 dataframe 中的 NA 值

Question

我是新手，仍在嘗試學習 R，但我無法在任何其他線程中找到我正在尋找的答案。

我有一個包含（為簡單起見）5 列的數據集。 第 1、2 和 4 列始終有值，但在某些行中，第 3 列沒有。 下面是一個例子：

當前的

A  B  C  D  E
1  1  2  3 
1  2  NA 4  5
1  2  3  4 
1  3  NA 9  7
1  2  NA 5  6

我想這樣做，以便將 NA 替換為 D 列中的值，然后將 col E 中的值轉移到 D，等等。

所需的 output：

A  B  C  D  E
1  1  2  3  NA
1  2  4  5  NA
1  2  3  4  NA
1  3  9  7  NA
1  2  5  6  NA

我復制了不同堆棧溢出線程上的內容，但沒有一個達到我想要的。

na.omit刪除該行。 任何幫助是極大的贊賞。

Answer 1

數據

data <- structure(list(A = c(1L, 1L, 1L, 1L, 1L), B = c(1L, 2L, 2L, 3L, 
2L), C = c(2L, NA, 3L, NA, NA), D = c(3L, 4L, 4L, 9L, 5L), E = c(NA, 
5L, NA, 7L, 6L)), class = "data.frame", row.names = c(NA, -5L
))

代碼

library(dplyr)

data %>% 
  mutate(
    aux = C,
    C = if_else(is.na(aux),D,C),
    D = if_else(is.na(aux),E,D),
    E = NA
  ) %>% 
  select(-aux)

Output

  A B C D  E
1 1 1 2 3 NA
2 1 2 4 5 NA
3 1 2 3 4 NA
4 1 3 9 7 NA
5 1 2 5 6 NA

Answer 2

一次更換操作 go：

dat[is.na(dat$C), c("C","D","E")] <- c(dat[is.na(dat$C), c("D","E")], NA)
dat
#  A B C D  E
#1 1 1 2 3 NA
#2 1 2 4 5 NA
#3 1 2 3 4 NA
#4 1 3 9 7 NA
#5 1 2 5 6 NA

dat在哪里：

dat <- read.table(text="A  B  C  D  E
1  1  2  3 
1  2  NA 4  5
1  2  3  4 
1  3  NA 9  7
1  2  NA 5  6", fill=TRUE, header=TRUE)

Answer 3

使用shift_row_values

library(hacksaw)
shift_row_values(df1)
  A B C D  E
1 1 1 2 3 NA
2 1 2 4 5 NA
3 1 2 3 4 NA
4 1 3 9 7 NA
5 1 2 5 6 NA

數據

df1 <- structure(list(A = c(1L, 1L, 1L, 1L, 1L), B = c(1L, 2L, 2L, 3L, 
2L), C = c(2L, NA, 3L, NA, NA), D = c(3L, 4L, 4L, 9L, 5L), E = c(NA, 
5L, NA, 7L, 6L)), class = "data.frame", row.names = c(NA, -5L
))

Answer 4

一種基本 R通用方法，在不事先了解NA位置的情況下使用order 。

setNames(data.frame(t(apply(data, 1, function(x) 
  x[order(is.na(x))]))), colnames(data))
  A B C D  E
1 1 1 2 3 NA
2 1 2 4 5 NA
3 1 2 3 4 NA
4 1 3 9 7 NA
5 1 2 5 6 NA

使用dplyr

library(dplyr)

t(data) %>% 
  data.frame() %>% 
  mutate(across(everything(), ~ .x[order(is.na(.x))])) %>% 
  t() %>% 
  as_tibble()
# A tibble: 5 × 5
      A     B     C     D     E
  <int> <int> <int> <int> <int>
1     1     1     2     3    NA
2     1     2     4     5    NA
3     1     2     3     4    NA
4     1     3     9     7    NA
5     1     2     5     6    NA

數據

data <- structure(list(A = c(1L, 1L, 1L, 1L, 1L), B = c(1L, 2L, 2L, 3L, 
2L), C = c(2L, NA, 3L, NA, NA), D = c(3L, 4L, 4L, 9L, 5L), E = c(NA, 
5L, NA, 7L, 6L)), class = "data.frame", row.names = c(NA, -5L
))

用下一列 (R) 中的變量替換 dataframe 中的 NA 值

問題描述

4 個解決方案

解決方案1
1 2023-01-08 23:43:42

數據

代碼

Output

解決方案2
1 2023-01-08 23:51:29

解決方案3
1 2023-01-09 05:12:25

數據

解決方案4
0 2023-01-09 01:16:42

數據

用下一列 (R) 中的變量替換 dataframe 中的 NA 值

問題描述

4 個解決方案

解決方案1 1 2023-01-08 23:43:42

數據

代碼

Output

解決方案2 1 2023-01-08 23:51:29

解決方案3 1 2023-01-09 05:12:25

數據

解決方案4 0 2023-01-09 01:16:42

數據

解決方案1
1 2023-01-08 23:43:42

解決方案2
1 2023-01-08 23:51:29

解決方案3
1 2023-01-09 05:12:25

解決方案4
0 2023-01-09 01:16:42