簡體   English   中英

將函數應用於多個並發列並輸出到新列-R

[英]Apply function to multiple concurrent columns and output to new column - R

好的,首先讓我生成一些樣本數據:

A_X01 <- c(34, 65, 23, 43, 22)
A_X02 <- c(2, 4, 7, 8, 3)
B_X01 <- c(24, 45, 94, 23, 54)
B_X02 <- c(4, 2, 4, 9, 1)
C_X01 <- c(34, 65, 876, 45, 87)
C_X02 <- c(123, 543, 86, 87, 34)
Var <- c(3, 5, 7, 2, 3)
DF <- data.frame(A_X01, A_X02, B_X01, B_X02, C_X01, C_X02, Var)

我要為X01和X02的A和B的並發列應用一個方程式,方程中使用第三列“ Var”。

到目前為止,我一直通過以下方式進行操作:

DF$D_X01 <- (DF$A_X01 + DF$B_X01) * DF$Var 
DF$D_X02 <- (DF$A_X02 + DF$B_X02) * DF$Var

我想要的輸出如下:

  A_X01 A_X02 B_X01 B_X02 C_X01 C_X02 Var D_X01 D_X02
1    34     2    24     4    34   123   3   174    18
2    65     4    45     2    65   543   5   550    30
3    23     7    94     4   876    86   7   819    77
4    43     8    23     9    45    87   2   132    34
5    22     3    54     1    87    34   3   228    12

正如您將欣賞的那樣,這是很多代碼行,可以做一些相當簡單的事情。 這意味着目前我的腳本相當長(因為我在實際數據集中有多個列)!

Apply函數之一必須是要走的路,但對於並發列,我似乎無法解決。 我確實考慮過使用lapply,但是如何將其用於列的兩個列表以及將正確的列加在一起?

我環顧四周,似乎無法找到一種解決方法,這肯定是一個相當普遍的問題?

謝謝。

編輯:原來的問題有點令人困惑,所以已經用所需的輸出和一些額外的條件進行了更新。

嘗試這個

indx <- gsub("\\D", "", grep("A_X|B_X", names(DF), value = TRUE)) # Retrieving indexes
indx2 <- DF[grep("A_X|B_X", names(DF))] # Considering only the columns of interest
DF[paste0("D_X", unique(indx))] <- 
   sapply(unique(indx), function(x) rowSums(indx2[which(indx == x)])*DF$Var)
DF
#   A_X01 A_X02 B_X01 B_X02 C_X01 C_X02 Var D_X01 D_X02
# 1    34     2    24     4    34   123   3   174    18
# 2    65     4    45     2    65   543   5   550    30
# 3    23     7    94     4   876    86   7   819    77
# 4    43     8    23     9    45    87   2   132    34
# 5    22     3    54     1    87    34   3   228    12

您也可以嘗試

indxA <- grep("^A", colnames(DF))
indxB <- grep("^B", colnames(DF))
f1 <- function(x,y,z) (x+y)*z
DF[sprintf('D_X%02d', indxA)] <- Map(f1 , DF[indxA], DF[indxB], list(DF$Var))
DF
#  A_X01 A_X02 B_X01 B_X02 C_X01 C_X02 Var D_X01 D_X02
#1    34     2    24     4    34   123   3   174    18
#2    65     4    45     2    65   543   5   550    30
#3    23     7    94     4   876    86   7   819    77
#4    43     8    23     9    45    87   2   132    34
#5    22     3    54     1    87    34   3   228    12

或者您可以使用mapply

DF[sprintf('D_X%02d', indxA)] <-  mapply(`+`, DF[indxA],DF[indxB])*DF$Var

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM