簡體   English   中英

R:如何刪除data.frame中的某些行

[英]R: how to remove certain rows in data.frame

> data = data.frame(a = c(100, -99, 322, 155, 256), b = c(23, 11, 25, 25, -999))
> data
    a    b
1 100   23
2 -99   11
3 322   25
4 155   25
5 256 -999

對於這樣的data.frame,我想刪除包含-99或-999的任何行。 所以我生成的data.frame應該只包含第1,3和4行。

我正在考慮為此編寫一個循環,但我希望有一個更簡單的方法。 (如果我的data.frame要有列az,那么循環方法將非常笨重)。 我的循環可能看起來像這樣

i = 1
for(i in 1:nrow(data)){
  if(data$a[i] < 0){
    data = data[-i,]
  }else if(data$b[i] < 0){
    data = data[-i,]
  }else data = data
}
 data [ rowSums(data == -99 | data==-999) == 0 , ]
    a  b
1 100 23
3 322 25
4 155 25

“==”和“|”都是 (OR)運算符作為矩陣作用於數據幀,返回相同維度的邏輯對象,以便rowSums成功。

也許這個:

ind <- Reduce(`|`,lapply(data,function(x) x %in% c(-99,-999)))
> data[!ind,]
    a  b
1 100 23
3 322 25
4 155 25

在導入過程中,@ rawr的評論可能最有意義。 不過,如果您已有數據,則可以執行類似操作:

na.omit(replace(data, sapply(data,`%in%`,c(-99,-999)), NA))
#    a  b
#1 100 23
#3 322 25
#4 155 25

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM