簡體 English 中英

根據匯總統計過濾掉data.table列

[英]Filter out data.table columns based on summary statistics

原文 2014-03-21 16:34:13 9 1 r/ data.table

我經常需要從 data.table 中篩選出低方差的列。 列名是事先未知的。

dt = data.table(mtcars)

# calculate standard deviation with arbitrary max value of 1:
mask = dt[,lapply(.SD, function(x) sd(x, na.rm = TRUE) > 1)]

# The columns with the FALSE values in row 1 need to be removed
mask.t = t(mask)
mask.t = which(mask.t)
dt[,mask.t,with=FALSE]

上面的方法很笨拙。 有沒有更優雅的方法來過濾列統計數據為 TRUE 的 data.table 中的列？

1 個解決方案

這些工作：

dt[, .SD, .SDcols=unlist(mask)] 

dt[, .SD, .SDcols=which(unlist(mask))]

現在都在一起了：

variance.filter = function(df) {
  mask = df[,lapply(.SD, function(x) sd(x,na.rm = TRUE) > 1)]
  df = df[, .SD, .SDcols = unlist(mask)] 
}

在`data.table` (1.12.9) 的當前開發版本中`data.table` ， `.SDcols`接受列的函數過濾器，因此這將起作用：

variance.filter = function(df) {
  df[ , .SD, .SDcols = function(x) sd(x, na.rm = TRUE) > 1]
}

按多列分組的匯總統計信息 dataframe vs. data.table vs. dplyr

[英]Summary statistics with grouping by multiple columns dataframe vs. data.table vs. dplyr

使用 data.table 計算所有數字列的匯總統計數據（例如平均值）

[英]Calculate summary statistics (e.g. mean) on all numeric columns using data.table

分組並匯總同一數據中的摘要統計信息。

[英]Group By and Aggregate Summary Statistics in Same Data.Table

使用data.table來自匯總組的摘要統計信息

[英]Summary statistics from aggregated groups using data.table

在data.table中按組進行回歸和匯總統計

[英]Regression and summary statistics by group within a data.table

根據其他data.table轉換data.table的列

[英]Transforming columns of data.table based on other data.table

R data.table 使用自定義函數創建匯總統計表的方式

[英]R data.table way to create summary statistics table with self-defined function

R Data.table用於計算多個列的摘要統計信息

[英]R Data.table for computing summary stats across multiple columns

動態地按多列過濾data.table

[英]Filter data.table by multiple columns, dynamically

連接或過濾幾列 data.table

[英]Concatenate or filter several columns data.table

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 按多列分組的匯總統計信息 dataframe vs. data.table vs. dplyr 使用 data.table 計算所有數字列的匯總統計數據（例如平均值）分組並匯總同一數據中的摘要統計信息。使用data.table來自匯總組的摘要統計信息在data.table中按組進行回歸和匯總統計根據其他data.table轉換data.table的列 R data.table 使用自定義函數創建匯總統計表的方式 R Data.table用於計算多個列的摘要統計信息動態地按多列過濾data.table 連接或過濾幾列 data.table

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM