循環遍歷具有標准的特定列並在 r 中中斷

Question

我想實現以下幾點：

檢查A001在哪一列，如果找到則返回列名，如果沒有找到則返回0
有時有超過 CHECK 列.. 最多可以有 20 列和附加列.. 我如何指定循環以遍歷這些列
不確定循環是正確的方法，但我覺得它是..我也願意接受其他選擇..

樣本數據和我的試驗如下

# sample
mydf <- data.frame(case = c(1, 2, 3),
                   id = c(10, 11, 12),
                   CHECK1 = c("A001", "B001", "C001"),
                   CHECK2 = c("Z001", "K001", "C001"),
                   CHECK3 = c("Z001", "B001", "A001"))

for (i in 1:3) {
  
  # giving out position and column name
  mydf = mydf %>% mutate(CHECK_Pos = case_when(mydf[paste0("CHECK", i)] == "A001" ~ i * 1,
                                               TRUE ~ 0),
                         
                         CHECK_Name = case_when(mydf[paste0("CHECK", i)] == "A001" ~ paste0("CHECK", i),
                                               TRUE ~ "CHECK0"))
  
}

這不起作用，因為它總是循環遍歷所有列到所有行的末尾，但我不知道如何在匹配時停止循環。 我理想的 output 是：CHECK_Pos = c(1, 0, 3) CHECK_Name = c("CHECK1", "CHECK0", "CHECK3") 請幫忙？？ 提前非常感謝~~！！

后續問題：如果我有更多列但我真的不知道如何更改代碼怎么辦

樣本

mydf <- data.frame(case = c(1, 2, 3),
                   id = c(10, 11, 12),
                   CHECK1 = c("A001", "B001", "C001"),
                   CHECK2 = c("Z001", "B001", "C001"),
                   CHECK3 = c("Z001", "B001", "C001"),
                   CHECK4 = c("Z001", "B001", "A001"),
                   CHECK5 = c("Z001", "B001", "C001"))

改裝試用：

get_colname = function(df, value) {
  ind = which(sapply(mydf[3:7], function (x) {value %in% x}))
  
  name = names(mydf[3:7])
  name[-ind] = "CHECK0"
  
  pos = 1:3
  pos[-ind] = 0
  
  if (length(ind) == 0) {
    name = rep("CHECK0", 3)
    pos = rep(0, 3)
  }
  df = df %>%
    mutate(check_pos = pos,
           check_name = name)
  
  return(df)
}

get_colname(mydf, "A001")

然后我會得到錯誤：錯誤：列check_name必須是長度 3（行數）或 1，而不是 5

我知道可能是這個“name = names(mydf[3:7])”導致錯誤..但我不知道要改成什么..請幫忙~

Answer 1

如果在if語句中使用break ，您可以停止匹配，但我看不到將其放在代碼中的哪個位置。 無論如何，這行得通。 簡而言之，它檢查每列的值是否為%in% 。

get_colname=function(df, value) {
  ind=which(sapply(mydf[3:5], function (x) {value %in% x}))
  name=names(mydf[3:5])
  name[-ind]="CHECK0"
  pos=1:3
  pos[-ind]=0
  if (length(ind)==0) {
    name=rep("CHECK0", 3)
    pos=rep(0,3)
  }
  df=mutate(df, check_pos=pos, check_name=name)
  return(df)
}

get_colname(mydf, "A001")
  case id CHECK1 CHECK2 CHECK3 check_pos check_name
1    1 10   A001   Z001   Z001         1     CHECK1
2    2 11   B001   K001   B001         0     CHECK0
3    3 12   C001   C001   A001         3     CHECK3

get_colname(mydf, "D001")
  case id CHECK1 CHECK2 CHECK3 check_pos check_name
1    1 10   A001   Z001   Z001         0     CHECK0
2    2 11   B001   K001   B001         0     CHECK0
3    3 12   C001   C001   A001         0     CHECK0

循環遍歷具有標准的特定列並在 r 中中斷

問題描述

樣本

1 個解決方案

解決方案1
1 已采納 2021-03-12 06:06:24

循環遍歷具有標准的特定列並在 r 中中斷

問題描述

樣本

1 個解決方案

解決方案1 1 已采納 2021-03-12 06:06:24

解決方案1
1 已采納 2021-03-12 06:06:24