將所有可能的對組合成一個 dataframe in R

Question

我正在嘗試創建一個循環，在其中我可以在一個數據框中獲得所有可能的組合。 這樣做的原因是我想稍后使用這些對來創建lm()和adf.test() 。 例如，我有一個數據框如下： df <- as.data.frame(cbind(1, 2, 3, 4)) 。

從這里我想得到所有可能的組合： pairs <- as.data.frame(cbind(c(1, 1, 1, 2, 2, 3), c(2,3,4,3,4,4))) 。

為此，我嘗試了幾種類似於此的 for 循環組合：

all_pairs = matrix(0, ((length(df)*(length(df)-1))/2), 2)
for (ij in 1:((length(df)*(length(df)-1))/2)) {
  for (i in 1:(length(df)-1)) {
    for (j in (i+1):length(df)) {
      all_pairs[ij, 1] = df[i,]
      all_pairs[ij,2] = df[j,]
    }
  }
}

((length(df)*(length(df)-1))/2)的原因是 comb=n(n-1)/2 是我如何計算所有組合而無需替換。

如前所述，我已經嘗試了幾種方法來做到這一點，但沒有一種有效。 這是實現我的目標的好方法嗎？ 如果是的話，我怎么能讓它工作？

提前致謝！

Answer 1

使用combn和m = 2得到組合對：

data.frame(t(combn(1:4, m = 2)))
  X1 X2
1  1  2
2  1  3
3  1  4
4  2  3
5  2  4
6  3  4

Answer 2

嘗試combn

> as.data.frame(t(combn(df, 2)))
  V1 V2
1  1  2
2  1  3
3  1  4
4  2  3
5  2  4
6  3  4

Answer 3

據我了解，您正在嘗試創建所有預測變量的可能組合，然后開發線性回歸 model。幾天前我寫了這個 function，也許您應該能夠重用它：

首先，x 表示所有預測變量，y 表示目標變量。 這將為您提供一個表格以及預測變量的所有組合及其誤差指標（RMSE、MAE、MSE 等）

LinearRegressionDA <- function(y, x, DatasetName,Split_Ratio=0.75) {

set.seed(12334)
split = sample.split(DatasetName, SplitRatio = Split_Ratio)
train = subset(DatasetName, split=="TRUE")
test = subset(DatasetName, split=="FALSE")

Data_list =do.call(c, lapply(seq_along(x), combn, x = x, simplify = FALSE))

Data_dataframe = data.frame(stringi::stri_list2matrix(
  do.call(c, lapply(seq_along(x), combn, x = x, simplify = FALSE)),
  byrow = TRUE
))
Data_dataframe[is.na(Data_dataframe)] <- ""

RMSE = list()
MAE = list()
Adj_R2 = list()
R2 = list()

for (i in 1:length(Data_list)){
    
model = lm(as.formula((paste(y,"~", paste(Data_list[[i]], collapse = "+")))), data = train)
predictions <- model %>% predict(test)

# Model performance

RMSE_ = MLmetrics::RMSE(predictions, test[,y])
RMSE = append(RMSE, RMSE_)
    
MAE_ = MAE(predictions, test[,y])
MAE = append(MAE, MAE_)
    
Adj_R2_ = summary(model)$adj.r.squared
Adj_R2 = append(Adj_R2, Adj_R2_)
    
R2_ = summary(model)$r.squared
R2 = append(R2, R2_)

}

Data_dataframe$RMSE = round(unlist(RMSE),3)
Data_dataframe$MAE = round(unlist(MAE),5)
Data_dataframe$Adj_R2 = round(unlist(Adj_R2),3)
Data_dataframe$R2 = round(unlist(R2),3)
    
list(Data_dataframe %>%arrange(desc(R2)))
}

您可以通過以下方式使用此 function：

LinearRegressionDA(y = "Y1", x = c("X1" ,"X2", "X3","X4"), DatasetName = df)[[1]]

將所有可能的對組合成一個 dataframe in R

問題描述

3 個解決方案

解決方案1
4 2022-04-28 13:44:18

解決方案2
2 2022-04-28 13:44:50

解決方案3
1 2022-04-28 13:54:23

將所有可能的對組合成一個 dataframe in R

問題描述

3 個解決方案

解決方案1 4 2022-04-28 13:44:18

解決方案2 2 2022-04-28 13:44:50

解決方案3 1 2022-04-28 13:54:23

解決方案1
4 2022-04-28 13:44:18

解決方案2
2 2022-04-28 13:44:50

解決方案3
1 2022-04-28 13:54:23