[英]How to avoid repeating code while using plyr
我想為某些數據組合生成相同類型的圖表。 目前,我正在使用plyr
來拆分數據並為每個組合執行一些代碼。
例如,假設dataframe
具有公司,部門,區域和收入。 這是我的偽代碼:
d_ply(dataframe, .(company), function(df) {
d_ply(df, .(department), function(df) {
d_ply(df, .(region), function(df) {
bar_chart(df$region, df$revenue)
})
bar_chart(df$department, df$revenue)
})
bar_chart(df$company, df$revenue)
})
在我的實例中,我需要做多件事,代碼是10行左右。 有沒有辦法避免重復每個組合中的代碼,除了創建一個函數,只是傳遞適當的參數? 我希望有一些神奇的plyr
技巧。
虛擬數據:
d <- data.frame(company=letters[1:26],
department=sample(letters[1:10],26,replace=TRUE),
region=sample(letters[1:3],26,replace=TRUE),
revenue=round(runif(26)*10000))
我認為有必要對您的代碼進行解釋:
d_ply(dataframe, .(company), function(df) { # by company
d_ply(df, .(department), function(df) { # by department
d_ply(df, .(region), function(df) { # by region
bar_chart(df$region, df$revenue)
# this part is essentially equal to
# d_ply(df, .(company,department,region), function(df), plot(df))
})
bar_chart(df$department, df$revenue)
# this part is essentially equal
# d_ply(df,.(company,department), function(df), fun(df))
})
bar_chart(df$company, df$revenue)
# this part is essentially equal to
# d_ply(df,.(company), function(df), fun(df))
})
我發現你的代碼非常難以理解。 它可以替換為:
some.fun <- function(df, ...) {
# ...
}
d_ply(d, .(company), function(df) some.fun(df, ...))
d_ply(d, .(company,department), function(df) some.fun(df, ...))
d_ply(d, .(company,department,region), function(df) some.fun(df, ...))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.