如何处理具有不同标签的 NA 值

Question

我在处理调查数据集中的 NA 值时遇到问题。

library(haven)
x <- labelled(
  c(1:3, tagged_na("a", "c", "z"), 4:1),
  c("Agreement" = 1, "Disagreement" = 4, 
    "First" = tagged_na("c"),
    "Refused" = tagged_na("a"), 
    "Not home" = tagged_na("z"))
)

这是 output

<Labelled double>
 [1]     1     2     3 NA(a) NA(c) NA(z)     4     3     2     1

Labels:
 value        label
     1    Agreement
     4 Disagreement
 NA(c)        First
 NA(a)      Refused
 NA(z)     Not home

我想要的是单独计算有多少 NA(c)、NA(a) 和 NA(z)，而不是作为一个整体。 我想根据 NA(c)、NA(a) 和 NA(z) 对数据进行子集化。 我怎样才能做到这一点。

谢谢！

Answer 1

检查这个：

base::table(haven::as_factor(x, levels = "labels"))

output

Agreement Disagreement        First 
       2            1            1 
 Refused     Not home 
       1            1

Answer 2

我们可以使用来自sjlabelled package 的get_values function，提取其中有NA的值并使用table来获取它们的计数。

table(grep('NA', sjlabelled::get_values(x), value = TRUE))

# NA(a) NA(c) NA(z) 
#    1     1     1

如何处理具有不同标签的 NA 值

问题描述

2 个解决方案

解决方案1
1 2020-04-20 04:34:20

解决方案2
0 2020-04-20 05:11:18

如何处理具有不同标签的 NA 值

问题描述

2 个解决方案

解决方案1 1 2020-04-20 04:34:20

解决方案2 0 2020-04-20 05:11:18

解决方案1
1 2020-04-20 04:34:20

解决方案2
0 2020-04-20 05:11:18