如何迭代 R 中因子的水平？

Question

我想創建一個函數，通過訪問第一個字母來幫助我識別因子級別中可能存在的錯誤，因此首先我將重點放在識別部分。

數據幀'''

alleles<-(c('A*24:02', 'A*11:01', 'blank',  'A*31:01'))
as.factor(alleles)
freq<-c(0.3782, 0.4209, 0.0362, 0.0761)

df<-data.frame(alleles, freq)

'''

我的嘗試_'''

for(i in df$alleles){
  if (i != 'A'){
    can<-c()
    append(can, i)
    df$alleles<-df$alleles[-c(can)]
  }
}

'''錯誤消息-c(can) 中的錯誤：一元運算符的參數無效

觀察如果我執行 '''print(can)''' 輸出為“NULL”，這意味着它不能使用“append”。

Answer 1

你也可以試試：

#Data
alleles<-(c('A*24:02', 'A*11:01', 'blank',  'A*31:01'))
freq<-c(0.3782, 0.4209, 0.0362, 0.0761)
df<-data.frame(alleles, freq)
can<-c()
#Check
for(i in 1:length(df$alleles))
{
  if (substr(df$alleles[i],1,1) != 'A'){
    can <- c(can, as.character(df$alleles[i]))
  }
}
#Apply
df<-df[-which(df$alleles %in% can),]

輸出：

df
  alleles   freq
1 A*24:02 0.3782
2 A*11:01 0.4209
4 A*31:01 0.0761

Answer 2

為什么不直接使用正則表達式？

df[grepl("^A", df$alleles),]

Answer 3

我們可以使用grep

df[grep("^A", df$alleles),]

如何迭代 R 中因子的水平？

問題描述

3 個解決方案

解決方案1
1 已采納 2020-11-21 19:16:34

解決方案2
0 2020-11-21 19:12:04

解決方案3
0 2020-11-21 21:36:22

如何迭代 R 中因子的水平？

問題描述

3 個解決方案

解決方案1 1 已采納 2020-11-21 19:16:34

解決方案2 0 2020-11-21 19:12:04

解決方案3 0 2020-11-21 21:36:22

解決方案1
1 已采納 2020-11-21 19:16:34

解決方案2
0 2020-11-21 19:12:04

解決方案3
0 2020-11-21 21:36:22