匹配R中单元格中的两个部分字符串

Question

我读过其他文章，例如：

选择行中的列具有类似“ hsa ..”（部分字符串匹配）的字符串的行

如何在名称包含特定字符串的R数据框中选择变量？

子集数据仅包含名称与条件匹配的列

但大多数都是简单的解决方法：

他们只有一个字符串要匹配
他们只有一个匹配的部分字符串

所以我在这里寻求帮助。

假设我们有一个示例数据表，如下所示：

sample = data.table('Feb FY2016', 50)
sample = rbind(sample, list('Mar FY2017', 30))
sample = rbind(sample, list('Feb FY2017', 40))
sample = rbind(sample, list('Mar FY2016', 10))
colnames(sample) = c('month', 'unit')

我如何子集数据，以便我的数据仅包含“月”列满足以下要求的行：

有2016年
以“ Mar”或“ Feb”开头

谢谢！

Answer 1

由于grep返回其匹配项的索引，因此它将返回与模式匹配的行，并可用于子集。

sample[grep('^(Feb|Mar).*2016$', sample$month),]

#         month unit
# 1: Feb FY2016   50
# 2: Mar FY2016   10

正则表达式寻找

行^的开始;
其次是Feb或Mar (Feb|Mar) ；
任何字符. 重复0到很多次* ;
恰好是2016 ；
然后是字符串$的结尾。

匹配R中单元格中的两个部分字符串

问题描述

1 个解决方案

解决方案1
2 已采纳 2016-03-16 06:48:46

匹配R中单元格中的两个部分字符串

问题描述

1 个解决方案

解决方案1 2 已采纳 2016-03-16 06:48:46

解决方案1
2 已采纳 2016-03-16 06:48:46