[英]R: how to remove certain rows in data.frame
> data = data.frame(a = c(100, -99, 322, 155, 256), b = c(23, 11, 25, 25, -999))
> data
a b
1 100 23
2 -99 11
3 322 25
4 155 25
5 256 -999
對於這樣的data.frame,我想刪除包含-99或-999的任何行。 所以我生成的data.frame應該只包含第1,3和4行。
我正在考慮為此編寫一個循環,但我希望有一個更簡單的方法。 (如果我的data.frame要有列az,那么循環方法將非常笨重)。 我的循環可能看起來像這樣
i = 1
for(i in 1:nrow(data)){
if(data$a[i] < 0){
data = data[-i,]
}else if(data$b[i] < 0){
data = data[-i,]
}else data = data
}
data [ rowSums(data == -99 | data==-999) == 0 , ]
a b
1 100 23
3 322 25
4 155 25
“==”和“|”都是 (OR)運算符作為矩陣作用於數據幀,返回相同維度的邏輯對象,以便rowSums成功。
也許這個:
ind <- Reduce(`|`,lapply(data,function(x) x %in% c(-99,-999)))
> data[!ind,]
a b
1 100 23
3 322 25
4 155 25
在導入過程中,@ rawr的評論可能最有意義。 不過,如果您已有數據,則可以執行類似操作:
na.omit(replace(data, sapply(data,`%in%`,c(-99,-999)), NA))
# a b
#1 100 23
#3 322 25
#4 155 25
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.