繁体   English   中英

如何找到大型数据框的非 NA 值(样本大小)?

[英]How to find non-NA values (sample size) of a large data frame?

我有一个包含大量 NA 的大型数据框。 行是来自不同地块的土壤样本,列是化学变量。 我想创建一个列或数据框,其中包含每个变量的样本大小,以确定哪些变量可能被欠采样。

当我尝试在线查看时,有一些特定于相关性测试的答案,并且答案侧重于查找特定值的出现次数,而不仅仅是非 NA 向量的存在,所以这对我没有帮助。

我可以通过计算每列中的 NA 并从样本数量中减去 NA 来强行解决这个问题,但是我有 400 列并且不知道如何编写 function?

样品编号 C:N %铁
情节1 46 3个
情节2 北美 5个

如果这是表格,我想要一个“C:N 样本大小”= 1,%Fe = 2 的列或数据框。这就是奇怪的地方,因为每个列变量只有 1 行,所以我想我想把它作为一个新的数据框或表格。

如果有任何指向为 R 的数据帧制作代表的好指南的链接,我也很感激 - 这是我的第一个问题。

谢谢!

这将为您提供your_dataframe中每列的NA

library(dplyr)
library(purrr)

your_dataframe %>% 
  map_df(~sum(is.na(.)))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM