R：反算补缺值

Question

我收到了一个数据集，其中所有低于 10 的值都已替换为 *。 但是，数据集还包含行和列总计，这部分地使反向计算成为可能。

对于我已经管理过的行，但对于列，我缺乏如何工作的灵感。

读取 CSV 文件时，* 被转换为 NA，因此示例数据集如下所示：

ID	V1	V2	V3	VS
A1	11	12	13	36
A2	不适用	11	12	32
A3	不适用	12	不适用	24
作为	27	35	32	92

在此示例中，ID A2 的 NA 应替换为 9 [ 32 - (11 + 12) ]。 下一步是计算 ID A3 的 NA。 V1 应替换为 7 [ 27 - (11 + 9) ] 和 V3 替换为 5 [ 32 - (13 + 12) ]

我觉得这实际上是最简单的问题之一，但我就是想不出解决方案。 谁能帮我解决这个问题？

非常感谢本尼

Answer 1

使用dplyr的解决方案：我分两步进行，1）计算按行执行的插补，2）特定于列的插补。

df <- read.table(text= "ID  V1  V2  V3  VS
A1  11  12  13  46
A2  NA  11  12  32
A3  NA  12  NA  24
AS  27  35  32  102", h = T) 


library(dplyr)
df %>%
  slice(1:2) %>% 
  mutate(across(V1:VS, ~ifelse(is.na(.x), VS - V3 - V2, .x))) %>% 
  rbind(df[3:4,1:5]) %>% 
  mutate(across(V1:VS, ~ifelse(is.na(.x), dplyr::lead(.x) - dplyr::lag(.x, 2) - dplyr::lag(.x,1), .x)))

结果：

  ID V1 V2 V3  VS
1 A1 11 12 13  46
2 A2  9 11 12  32
3 A3  7 12  7  24
4 AS 27 35 32 102

R：反算补缺值

问题描述

1 个解决方案

解决方案1
1 2022-07-26 08:32:33

R：反算补缺值

问题描述

1 个解决方案

解决方案1 1 2022-07-26 08:32:33

解决方案1
1 2022-07-26 08:32:33