將 function 應用於 R 中每 n 列的每一行

Question

我的數據包含連續的列 1,2,...,2000。 我想應用一個函數，該函數為每行的每組 100 列返回 3 個變量。

數據如下所示：

  1       2        3    .....   2000  
0.01    0.0       0.002         0.03
0.005   0.002     0.011         0.04
0.001   0.003     0.004         0.0

這是我試過的代碼：

prep_data <- function(df){
  #Create Column names
  colnms<-c()
  for(i in seq(1, 20, 1)){
    
    for(j in seq(1, 3, 1)){
      f<-paste0("grp",i,"_",j)
      colnms=c(colnms,f)
    }
    
  }
  #
  trans <- data.frame(matrix(ncol = 60, nrow = NROW(df)))
  colnames(trans) <-colnms

#Looping over every row
  for (i in 1:NROW(df)){
      X = c()
      #LOOPING over each group of 100 columns
      for(j in seq(1, 1900, 100)){
        end<-j+99
        tmp<-subset(df[i], select=j:end)
        #Here I apply the function over the 100 columns for the current row to get 3 values#
          X = c(X,MY_FUNC(tmp))
         ###################################################################################          
}
      }
#Append the current row
      trans[i,] <- X
  }
  return(trans)
  
}

預期的output（60列的A dataframe）如下：

grp1_1  grp1_2    grp1_3 .....  grp20_3  
0.01    0.0       0.002         0.03
0.005   0.002     0.011         0.04
0.001   0.003     0.004         0.0

我的代碼運行但速度太慢可能是因為它對所有循環都沒有效率

提前致謝

Answer 1

這是一種方法：

假設d是您的 3 行 x 2000 列框架，列名為as.character(1:2000) （請參閱下面的假數據生成）。 我們使用.I添加行標識符，然后融化數據 long，添加grp和列組標識符（即標識 20 組 100）。 然后按行和組應用 function myfunc （請參閱下面的替代 function），寬 swing。 （我用stringr::str_pad在組號前面加了0）

# add row identifier
d[, row:=.I]

# melt and add col group identifier
dm = melt(d,id.vars = "row",variable.factor = F)[,variable:=as.numeric(variable)][order(variable,row), grp:=rep(1:20, each=300)]

# get the result (180 rows long), applying myfync to each set of columns, by row
result = dm[, myfunc(value), by=.(row,grp)][,frow:=rep(1:3,times=60)]

# swing wide (3 rows long, 60 columns wide)
dcast(
  result[,v:=paste0("grp",stringr::str_pad(grp,2,pad = "0"),"_",row)],
  frow~v,value.var="V1"
  )[, frow:=NULL][]

Output：（僅前六列）

      grp01_1    grp01_2    grp01_3    grp02_1    grp02_2    grp02_3
        <num>      <num>      <num>      <num>      <num>      <num>
1: 0.54187168 0.47650694 0.48045694 0.51278399 0.51777319 0.46607845
2: 0.06671367 0.08763655 0.08076939 0.07930063 0.09830116 0.07807937
3: 0.25828989 0.29603471 0.28419957 0.28160367 0.31353016 0.27942687

輸入：

d = data.table()
alloc.col(d,2000)
set.seed(123)
for(c in 1:2000)  set(d,j=as.character(c), value=runif(3))

myfunc Function（這個答案的玩具示例）：

myfunc <- function(x) c(mean(x), var(x), sd(x))

將 function 應用於 R 中每 n 列的每一行

問題描述

1 個解決方案

解決方案1
2 已采納 2022-03-16 20:09:55

將 function 應用於 R 中每 n 列的每一行

問題描述

1 個解決方案

解決方案1 2 已采納 2022-03-16 20:09:55

解決方案1
2 已采納 2022-03-16 20:09:55