簡體   English   中英

循環遍歷具有標准的特定列並在 r 中中斷

[英]loop through specific columns with criteria and break in r

我想實現以下幾點:

  1. 檢查A001在哪一列,如果找到則返回列名,如果沒有找到則返回0
  2. 有時有超過 CHECK 列.. 最多可以有 20 列和附加列.. 我如何指定循環以遍歷這些列
  3. 不確定循環是正確的方法,但我覺得它是..我也願意接受其他選擇..

樣本數據和我的試驗如下

# sample
mydf <- data.frame(case = c(1, 2, 3),
                   id = c(10, 11, 12),
                   CHECK1 = c("A001", "B001", "C001"),
                   CHECK2 = c("Z001", "K001", "C001"),
                   CHECK3 = c("Z001", "B001", "A001"))

for (i in 1:3) {
  
  # giving out position and column name
  mydf = mydf %>% mutate(CHECK_Pos = case_when(mydf[paste0("CHECK", i)] == "A001" ~ i * 1,
                                               TRUE ~ 0),
                         
                         CHECK_Name = case_when(mydf[paste0("CHECK", i)] == "A001" ~ paste0("CHECK", i),
                                               TRUE ~ "CHECK0"))
  
}

這不起作用,因為它總是循環遍歷所有列到所有行的末尾,但我不知道如何在匹配時停止循環。 我理想的 output 是:CHECK_Pos = c(1, 0, 3) CHECK_Name = c("CHECK1", "CHECK0", "CHECK3") 請幫忙?? 提前非常感謝~~!!

后續問題:如果我有更多列但我真的不知道如何更改代碼怎么辦

樣本

mydf <- data.frame(case = c(1, 2, 3),
                   id = c(10, 11, 12),
                   CHECK1 = c("A001", "B001", "C001"),
                   CHECK2 = c("Z001", "B001", "C001"),
                   CHECK3 = c("Z001", "B001", "C001"),
                   CHECK4 = c("Z001", "B001", "A001"),
                   CHECK5 = c("Z001", "B001", "C001"))

改裝試用:

get_colname = function(df, value) {
  ind = which(sapply(mydf[3:7], function (x) {value %in% x}))
  
  name = names(mydf[3:7])
  name[-ind] = "CHECK0"
  
  pos = 1:3
  pos[-ind] = 0
  
  if (length(ind) == 0) {
    name = rep("CHECK0", 3)
    pos = rep(0, 3)
  }
  df = df %>%
    mutate(check_pos = pos,
           check_name = name)
  
  return(df)
}

get_colname(mydf, "A001")

然后我會得到錯誤:錯誤:列check_name必須是長度 3(行數)或 1,而不是 5

我知道可能是這個“name = names(mydf[3:7])”導致錯誤..但我不知道要改成什么..請幫忙~

如果在if語句中使用break ,您可以停止匹配,但我看不到將其放在代碼中的哪個位置。 無論如何,這行得通。 簡而言之,它檢查每列的值是否為%in%

get_colname=function(df, value) {
  ind=which(sapply(mydf[3:5], function (x) {value %in% x}))
  name=names(mydf[3:5])
  name[-ind]="CHECK0"
  pos=1:3
  pos[-ind]=0
  if (length(ind)==0) {
    name=rep("CHECK0", 3)
    pos=rep(0,3)
  }
  df=mutate(df, check_pos=pos, check_name=name)
  return(df)
}

get_colname(mydf, "A001")
  case id CHECK1 CHECK2 CHECK3 check_pos check_name
1    1 10   A001   Z001   Z001         1     CHECK1
2    2 11   B001   K001   B001         0     CHECK0
3    3 12   C001   C001   A001         3     CHECK3

get_colname(mydf, "D001")
  case id CHECK1 CHECK2 CHECK3 check_pos check_name
1    1 10   A001   Z001   Z001         0     CHECK0
2    2 11   B001   K001   B001         0     CHECK0
3    3 12   C001   C001   A001         0     CHECK0

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM