繁体   English   中英

检查 R dataframe 中的值是否符合列值/列表中值的任意组合

[英]Check if a value in a R dataframe adheres to a column values/any combination of the values in a list

我有一个非常大的 dataframe,我需要检查特定列的值是否符合列表中的项目。 这可以是列表中的任何项目,也可以是用逗号分隔的项目组合。

在下面的示例中,我只希望最后一个值(“无颜色”)抛出失败,因为它没有出现在名为 Type 的列表中。

Type <- list(c('blue','green','black','red'))

Data <-data.frame(colour=c("blue","blue,green", 'blue,black,red', 'black,red', 'no colour'))

谢谢

我们可以paste list中的元素并filter

library(stringr)
library(dplyr)
Data %>% 
  filter(str_detect(colour, str_c(Type[[1]], collapse = "|")))

-输出

           colour
1           blue
2     blue,green
3 blue,black,red
4      black,red

使用strsplit

sapply(strsplit(Data$colour, ','), \(x) all(x %in% Type[[1]]))
# [1]  TRUE  TRUE  TRUE  TRUE FALSE

这是另一个可能的选项,我们可以从列表中删除任何颜色,然后清理剩余的字符(删除空格和逗号)。 然后,我使用nzchar检测是否还有剩余的单词,如果有,则删除该行。

Data[!nzchar(trimws(gsub(
  "[[:punct:]]", "", gsub(paste0(Type[[1]], collapse = "|"), "", Data$colour)
))), ]

Output

          colour
1           blue
2     blue,green
3 blue,black,red
4      black,red

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM