如何找到大型数据框的非 NA 值（样本大小）？

Question

我有一个包含大量 NA 的大型数据框。 行是来自不同地块的土壤样本，列是化学变量。 我想创建一个列或数据框，其中包含每个变量的样本大小，以确定哪些变量可能被欠采样。

当我尝试在线查看时，有一些特定于相关性测试的答案，并且答案侧重于查找特定值的出现次数，而不仅仅是非 NA 向量的存在，所以这对我没有帮助。

我可以通过计算每列中的 NA 并从样本数量中减去 NA 来强行解决这个问题，但是我有 400 列并且不知道如何编写 function？

样品编号	C:N	%铁
情节1	46	3个
情节2	北美	5个

如果这是表格，我想要一个“C:N 样本大小”= 1，%Fe = 2 的列或数据框。这就是奇怪的地方，因为每个列变量只有 1 行，所以我想我想把它作为一个新的数据框或表格。

如果有任何指向为 R 的数据帧制作代表的好指南的链接，我也很感激 - 这是我的第一个问题。

谢谢！

Answer 1

这将为您提供your_dataframe中每列的NA

library(dplyr)
library(purrr)

your_dataframe %>% 
  map_df(~sum(is.na(.)))