[英]Select columns with many observations
我有一個包含大量觀察結果和大量變量的數據集。 但是一些變量只有一些觀察結果的真實值。 如何刪除少於500個觀察值的變量?
我一直試圖在dplyr
的上下文中dplyr
一種方法來做到這dplyr
,但是select()
似乎不會那樣工作。
這也不是很有意義,但這是我一直在思考的方向:
dat[,sum(!is.na) > 500]
我們可以使用vapply
dat[vapply(dat, function(x) sum(is.na(x)) <=500, 0)]
或搭配Filter
Filter(function(x) sum(is.na(x)) <= 500, dat)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.