如何在R中使用mutate_at計算加權平均值？

Question

我有一個包含許多列的數據框（“df”），我想估計這些列的加權平均值、按人口加權（df$Population）和按通勤區分組（df$cz）。

這是我想估計加權平均值的列列表：

 vlist = c("Public_Welf_Total_Exp", "Welf_Cash_Total_Exp", "Welf_Cash_Cash_Assist", "Welf_Ins_Total_Exp","Total_Educ_Direct_Exp", "Higher_Ed_Total_Exp", "Welf_NEC_Cap_Outlay","Welf_NEC_Direct_Expend", "Welf_NEC_Total_Expend", "Total_Educ_Assist___Sub", "Health_Total_Expend", "Total_Hospital_Total_Exp", "Welf_Vend_Pmts_Medical","Hosp_Other_Total_Exp","Unemp_Comp_Total_Exp", "Unemp_Comp_Cash___Sec", "Total_Unemp_Rev", "Hous___Com_Total_Exp", "Hous___Com_Construct")

這是我一直在使用的代碼：

 df = df %>% group_by(cz) %>% mutate_at(vlist, weighted.mean(., df$Population))

我也試過：

 df = df %>% group_by(cz) %>% mutate_at(vlist, function(x) weighted.mean(x, df$Population))

以及僅在 2 列上測試了以下代碼：

 df = df %>% group_by(cz) %>% mutate_at(vars(Public_Welf_Total_Exp, Welf_Cash_Total_Exp), weighted.mean(., df$Population))

但是，即使我的任何變量中都沒有 NA，我所嘗試的一切都給了我以下錯誤：

 Error in weighted.mean.default(., df$Population) : 
   'x' and 'w' must have the same length

我知道我可以使用 lapply 進行以下估計，但我不知道如何使用 lapply 按另一個變量分組。 我將不勝感激任何建議！

Answer 1

這里有很多東西要解開......

可能您的意思是summarise而不是mutate ，因為使用mutate您只需復制每一行的結果。
mutate_at和summarise_at被subseeded，你應該使用across代替。
您的代碼不起作用的原因是因為您沒有將函數編寫為公式（您沒有在開頭添加~ ），而且您使用的是df$Population而不是Population 。 當您編寫Population ， summarise知道您正在談論的是Population列，此時該列與數據框的其余部分一樣分組。 當您使用df$Population您是在不分組的情況下調用原始數據框的列。 這不僅是錯誤的，而且還會出錯，因為您嘗試平均的變量長度與df$Population提供的權重長度df$Population 。

以下是您可以這樣做的方法：

library(dplyr)

df %>%
   group_by(cz) %>% 
   summarise(across(vlist, weighted.mean, Population),
             .groups = "drop")

如果您確實需要使用summarise_at （並且您可能正在使用舊版本的dplyr [低於 1.0.0]），那么您可以這樣做：

df %>%
   group_by(cz) %>% 
   summarise_at(vlist, ~weighted.mean(., Population)) %>%
   ungroup()

我認為df和vlist如下所示：

vlist <- c("Public_Welf_Total_Exp", "Welf_Cash_Total_Exp", "Welf_Cash_Cash_Assist", "Welf_Ins_Total_Exp","Total_Educ_Direct_Exp", "Higher_Ed_Total_Exp", "Welf_NEC_Cap_Outlay","Welf_NEC_Direct_Expend", "Welf_NEC_Total_Expend", "Total_Educ_Assist___Sub", "Health_Total_Expend", "Total_Hospital_Total_Exp", "Welf_Vend_Pmts_Medical","Hosp_Other_Total_Exp","Unemp_Comp_Total_Exp", "Unemp_Comp_Cash___Sec", "Total_Unemp_Rev", "Hous___Com_Total_Exp", "Hous___Com_Construct")
df <- as.data.frame(matrix(rnorm(length(vlist) * 100), ncol = length(vlist)))
names(df) <- vlist
df$cz <- rep(letters[1:10], each = 10)
df$Population <- runif(100)

如何在R中使用mutate_at計算加權平均值？

問題描述

1 個解決方案

解決方案1
1 已采納 2020-10-29 16:31:52

如何在R中使用mutate_at計算加權平均值？

問題描述

1 個解決方案

解決方案1 1 已采納 2020-10-29 16:31:52

解決方案1
1 已采納 2020-10-29 16:31:52