[英]Outlier in dataframe, but I want to do it for grouped rows in a dataframe in R
我们可以根据我们的要求修改这个函数,并使用它来过滤每个组的异常值并创建一个新的数据框。
library(dplyr)
remove_outliers <- function(x, na.rm = TRUE, ...) {
qnt <- quantile(x, probs=c(.25, .75), na.rm = na.rm, ...)
H <- 1.5 * IQR(x, na.rm = na.rm)
x < (qnt[1] - H) | x > (qnt[2] + H)
}
separate_dataframe <- x %>% group_by(species) %>% filter(remove_outliers(sum))
separate_dataframe
# species sum
# <fct> <dbl>
#1 Beta -100
数据
x = data.frame(species = c("Agao", "Beta", "Beta", "Beta", "Beta",
"Carrot", "Carrot"),sum = c(1, 1, 5, 4, -100, 3,0))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.