R：for loop output 仅将最后结果保存在 output Z6A8064B5DF4779455507DZC553

Question

我有以下 for 循环脚本：

# Create example data
dataKM <- data.frame(x1 = 1:5,    
                     x2 = 6:10,
                     x3 = 11:15)
# Duplicate dataframe
datatest <- dataKM[c(1:3)]

# for loop
for(i in colnames(dataKM[,2:ncol(dataKM)])) {
  # median of each single column of dataframe
  median <- median(dataKM[,i])
  # add column in duplicated dataframe with 'High' or 'low' based on median for each column
  datatest$median[dataKM[,i] <= median ] <- "Low"
  datatest$median[dataKM[,i] > median ] <- "High"
}

我正在尝试对dataKM dataframe的每一列重复for循环，并将结果保存为数据集dataframe中的列。 我的脚本只保存最后一次迭代。 可能我得到一个 output 因为我在循环中的每次传递时覆盖了以前的值。 我想知道如何将所有 for loop output 保存在各自的列中。 谁能帮我？ 非常感谢，我希望这对尝试做类似事情的其他人也有用。

Answer 1

我们可以使用lapply function

datatest <- dataKM[c(2:3)]
datatest[] <- lapply(dataKM[-1] , function(x) ifelse(x <= median(x) , "Low" , "High"))

colnames(datatest) <- c("x2Median" , "x3Median")

cbind(dataKM , datatest)

output

  x1 x2 x3  x2Median x3Median
1  1  6 11      Low      Low
2  2  7 12      Low      Low
3  3  8 13      Low      Low
4  4  9 14      High     High
5  5 10 15      High     High

如果你坚持使用for loop试试这个

datatest <- dataKM[c(1:3)]

for(i in colnames(dataKM[-1])) {
    median <- median(dataKM[,i])
    datatest[[paste0(i,"median")]][dataKM[,i] <= median ] <- "Low"
    datatest[[paste0(i,"median")]][dataKM[,i] > median ] <- "High"
}

Answer 2

我不确定什么与什么比较。 但这里有一个示例，将 x2 值或 x3 值与其列中位数进行比较：

这是 dplyr 方法：

library(dplyr)

dataKM %>% 
  mutate(across(-1, ~case_when(. <= median(., na.rm=TRUE) ~ "Low",
                               . > median(., nar.rm=TRUE) ~ "High"), .names = "Median_{.col}"))

  x1 x2 x3 Median_x2 Median_x3
1  1  6 11       Low       Low
2  2  7 12       Low       Low
3  3  8 13       Low       Low
4  4  9 14      High      High
5  5 10 15      High      High

Answer 3

目前，您正在更新一个新列median 。 只需调整以在for循环的每次迭代中创建新的中值列，将列当前列名称和中值连接起来。

# for loop
for(col in colnames(dataKM[,2:ncol(dataKM)])) {
  curr_col <- dataKM[[col]]
  # median of each single column of dataframe
  col_median <- median(curr_col)

  # add column in duplicated dataframe with 'High' or 'low' based on median for each column
  datatest[[paste0(col, "_median")]][curr_col <= col_median] <- "Low"
  datatest[[paste0(col, "_median")]][curr_col > col_median] <- "High"
}

或者，使用ifelse ：

for(col in colnames(dataKM[,2:ncol(dataKM)])) {
  curr_col <- dataKM[[col]]
  col_median <- median(curr_col)

  datatest[[paste0(col, "_median")]] <- ifelse(
    curr_col <= col_median, "Low", " High"
  )
}

R：for loop output 仅将最后结果保存在 output Z6A8064B5DF4779455507DZC553

问题描述

3 个解决方案

解决方案1
2 2022-07-30 16:03:59

解决方案2
1 已采纳 2022-07-30 16:07:33

解决方案3
0 2022-07-30 16:27:11

R：for loop output 仅将最后结果保存在 output Z6A8064B5DF4779455507DZC553

问题描述

3 个解决方案

解决方案1 2 2022-07-30 16:03:59

解决方案2 1 已采纳 2022-07-30 16:07:33

解决方案3 0 2022-07-30 16:27:11

解决方案1
2 2022-07-30 16:03:59

解决方案2
1 已采纳 2022-07-30 16:07:33

解决方案3
0 2022-07-30 16:27:11