繁体 English 中英

使用R中的data.table从组中删除异常值

[英]Removing outliers from groups using data.table in R

原文 2015-10-21 10:56:58 4 1 r/ data.table

我有一个包含组列的data.table对象。 我正在尝试从每个组中删除离群值，但是我无法为此提出一个不错的解决方案。 我的data.table可以使用简单的脚本构建：

col1 <- rnorm(30, mean = 5, sd = 2)
col2 <- rnorm(30, mean = 5, sd = 2)
id <- seq(1, 30)
group <- sample(4, 30, replace = TRUE)
dt <- data.table(id, group, col1, col2)

我一直在尝试通过组变量拆分data.frame，但是，这太乱了。 如何在没有太多数据转换的情况下“轻松”地从data.table中的每个组中删除前n％个离群值？

1 个解决方案

假设您要根据col1和col2基于95％的分位数删除异常值：

dt_filt <- dt[, 
    .SD[
        ((col1 < quantile(col1, probs = 0.95)) & 
         (col2 < quantile(col2, probs = 0.95)))
    ], by = group
]

它基本上根据group列拆分数据，计算阈值，然后对数据进行子集以仅保留col1和col2低于阈值的行。

R：按组对data.table进行操作，去除异常值

[英]R: Operations on data.table by group, removing outliers

在 Data.Table 或 R 中的 DPLYR 中删除所有 NA 的组

[英]Removing groups with all NA in Data.Table or DPLYR in R

按R中的data.table计算每组的平均月总数

[英]Calculate average monthly total by groups from data.table in R

过滤多个R data.table列以消除异常值

[英]Filter multiple R data.table columns to eliminate outliers

根据两个条件从 R 中的 data.table 中删除行

[英]removing rows based on two conditions from a data.table in R

根据条件从 R 中的 data.table 中删除列

[英]Removing columns from a data.table in R based on conditions

R data.table中各组之间的相关性

[英]Correlation between groups in R data.table

data.table r中按组的慢功能

[英]slow function by groups in data.table r

R data.table所有组的交集

[英]R data.table intersection of all groups

在 r data.table 中查找重复组

[英]Find repeating groups in r data.table

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 R：按组对data.table进行操作，去除异常值在 Data.Table 或 R 中的 DPLYR 中删除所有 NA 的组按R中的data.table计算每组的平均月总数过滤多个R data.table列以消除异常值根据两个条件从 R 中的 data.table 中删除行根据条件从 R 中的 data.table 中删除列 R data.table中各组之间的相关性 data.table r中按组的慢功能 R data.table所有组的交集在 r data.table 中查找重复组

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM