如何在使用plyr時避免重復代碼

Question

我想為某些數據組合生成相同類型的圖表。 目前，我正在使用plyr來拆分數據並為每個組合執行一些代碼。

例如，假設dataframe具有公司，部門，區域和收入。 這是我的偽代碼：

     d_ply(dataframe, .(company),  function(df) {
      d_ply(df, .(department),  function(df) {
        d_ply(df, .(region), function(df) {
           bar_chart(df$region, df$revenue)
        })
            bar_chart(df$department, df$revenue)
      })
            bar_chart(df$company, df$revenue)
    })

在我的實例中，我需要做多件事，代碼是10行左右。 有沒有辦法避免重復每個組合中的代碼，除了創建一個函數，只是傳遞適當的參數？ 我希望有一些神奇的plyr技巧。

Answer 1

虛擬數據：

d <- data.frame(company=letters[1:26],
                department=sample(letters[1:10],26,replace=TRUE),
                region=sample(letters[1:3],26,replace=TRUE),
                revenue=round(runif(26)*10000))

更新

我認為有必要對您的代碼進行解釋：

d_ply(dataframe, .(company),  function(df) { # by company
      d_ply(df, .(department),  function(df) { # by department
        d_ply(df, .(region), function(df) { # by region
           bar_chart(df$region, df$revenue)
           # this part is essentially equal to
           # d_ply(df, .(company,department,region), function(df), plot(df)) 
    })
  bar_chart(df$department, df$revenue)
  # this part is essentially equal 
  # d_ply(df,.(company,department), function(df), fun(df))
  })
 bar_chart(df$company, df$revenue)
 # this part is essentially equal to 
 # d_ply(df,.(company), function(df), fun(df))
})

我發現你的代碼非常難以理解。 它可以替換為：

some.fun <- function(df, ...) {
# ...
}

d_ply(d, .(company), function(df) some.fun(df, ...))
d_ply(d, .(company,department), function(df) some.fun(df, ...)) 
d_ply(d, .(company,department,region), function(df) some.fun(df, ...))

如何在使用plyr時避免重復代碼

問題描述

1 個解決方案

解決方案1
1 已采納 2012-12-13 19:26:36

更新

如何在使用plyr時避免重復代碼

問題描述

1 個解決方案

解決方案1 1 已采納 2012-12-13 19:26:36

更新

解決方案1
1 已采納 2012-12-13 19:26:36