[英]Check if a value in a R dataframe adheres to a column values/any combination of the values in a list
我有一个非常大的 dataframe,我需要检查特定列的值是否符合列表中的项目。 这可以是列表中的任何项目,也可以是用逗号分隔的项目组合。
在下面的示例中,我只希望最后一个值(“无颜色”)抛出失败,因为它没有出现在名为 Type 的列表中。
Type <- list(c('blue','green','black','red'))
Data <-data.frame(colour=c("blue","blue,green", 'blue,black,red', 'black,red', 'no colour'))
谢谢
我们可以paste
list
中的元素并filter
library(stringr)
library(dplyr)
Data %>%
filter(str_detect(colour, str_c(Type[[1]], collapse = "|")))
-输出
colour
1 blue
2 blue,green
3 blue,black,red
4 black,red
使用strsplit
。
sapply(strsplit(Data$colour, ','), \(x) all(x %in% Type[[1]]))
# [1] TRUE TRUE TRUE TRUE FALSE
这是另一个可能的选项,我们可以从列表中删除任何颜色,然后清理剩余的字符(删除空格和逗号)。 然后,我使用nzchar
检测是否还有剩余的单词,如果有,则删除该行。
Data[!nzchar(trimws(gsub(
"[[:punct:]]", "", gsub(paste0(Type[[1]], collapse = "|"), "", Data$colour)
))), ]
Output
colour
1 blue
2 blue,green
3 blue,black,red
4 black,red
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.