使用函數，該函數對R中的分組數據返回轉換后的數據

Question

我有一個包含多個分組的大型數據集。 我創建了一個函數，該函數返回沒有異常值的數據。 因此，如果您有100個觀測值，它將用NA填充異常值，並返回100個觀測值）

我有一個帶有兩列具有分組變量的數據框（例如，男性/女性雇員/失業者）。 第三列將包含需要刪除異常值的實際數據（例如薪水）。

有什么我可以使用的函數可以返回一個數據框或矩陣，其中每個分組變量都刪除了異常值。

就像是：

data.without.outlier <- function.unknown(data, by=list(data[,"employment"],data[,"sex"]), FUN = (my outlier function))

歡迎提出所有建議！

Answer 1

假設您的“ myoutlierfunction”返回一個數據幀，則可以像下面這樣使用dplyr：

library(dplyr)
data.without.outlier = data %>%
  group_by(employment, sex) %>%
  do(myoutlierfunction)