簡體   English   中英

使用函數,該函數對R中的分組數據返回轉換后的數據

[英]use function that returns transformed data on grouped data in R

我有一個包含多個分組的大型數據集。 我創建了一個函數,該函數返回沒有異常值的數據。 因此,如果您有100個觀測值,它將用NA填充異常值,並返回100個觀測值)

我有一個帶有兩列具有分組變量的數據框(例如,男性/女性雇員/失業者)。 第三列將包含需要刪除異常值的實際數據(例如薪水)。

有什么我可以使用的函數可以返回一個數據框或矩陣,其中每個分組變量都刪除了異常值。

就像是:

data.without.outlier <- function.unknown(data, by=list(data[,"employment"],data[,"sex"]), FUN = (my outlier function))

歡迎提出所有建議!

假設您的“ myoutlierfunction”返回一個數據幀,則可以像下面這樣使用dplyr:

library(dplyr)
data.without.outlier = data %>%
  group_by(employment, sex) %>%
  do(myoutlierfunction)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM