簡體   English   中英

選擇包含許多觀察結果的列

[英]Select columns with many observations

我有一個包含大量觀察結果和大量變量的數據集。 但是一些變量只有一些觀察結果的真實值。 如何刪除少於500個觀察值的變量?

我一直試圖在dplyr的上下文中dplyr一種方法來做到這dplyr ,但是select()似乎不會那樣工作。

這也不是很有意義,但這是我一直在思考的方向:

dat[,sum(!is.na) > 500]

我們可以使用vapply

dat[vapply(dat, function(x) sum(is.na(x)) <=500, 0)]

或搭配Filter

Filter(function(x) sum(is.na(x)) <= 500, dat)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM