[英]use function that returns transformed data on grouped data in R
我有一個包含多個分組的大型數據集。 我創建了一個函數,該函數返回沒有異常值的數據。 因此,如果您有100個觀測值,它將用NA填充異常值,並返回100個觀測值)
我有一個帶有兩列具有分組變量的數據框(例如,男性/女性雇員/失業者)。 第三列將包含需要刪除異常值的實際數據(例如薪水)。
有什么我可以使用的函數可以返回一個數據框或矩陣,其中每個分組變量都刪除了異常值。
就像是:
data.without.outlier <- function.unknown(data, by=list(data[,"employment"],data[,"sex"]), FUN = (my outlier function))
歡迎提出所有建議!
假設您的“ myoutlierfunction”返回一個數據幀,則可以像下面這樣使用dplyr:
library(dplyr)
data.without.outlier = data %>%
group_by(employment, sex) %>%
do(myoutlierfunction)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.