在 R 的循环中使用 grep、grepl 和 regexpr

Question

我想使用 grep、grepl 和 regexpr 从文本文件中自动提取某些信息。 我有一个代码，当我为每个单独的文件执行此操作时，它可以工作，但是我无法使循环正常工作，无法为我的工作目录中的所有文件自动执行此过程。

由于数据的结构，我将 txt 文件作为字符串读取。 循环似乎根据目录中的文件数多次迭代第一个文件，显然是因为for语句中的length(txtfiles)命令。

txtfiles = list.files(pattern="*.txt")

for (i in 1:length(txtfiles)){
all_data <- readLines(txtfiles[i])

#select hours of operation 
hours_op[i] <- all_data[hours_of_operation <- grep("Annual Hours of Operation:",all_data)]
hours_op[i] <-regmatches(hours_op, regexpr("[0-9]{1,9}.[0-9]{1,9}",hours_op))

}

如果有人能指出我正确的方向来为每个文件重复这个例程，而不是多次重复同一个文件，我将不胜感激。 我想得到一个文件名列表和相应的hours_op 。

Answer 1

您需要为每个对hours_op[i]引用添加一个索引 ( [i] )，如下所示：

for (i in 1:length(txtfiles)){
    all_data <- readLines(txtfiles[i])
    hours_op[i] <- all_data[hours_of_operation <- grep("Annual Hours of Operation:",all_data)]
    hours_op[i] <-regmatches(hours_op[i], regexpr("[0-9]{1,9}.[0-9]{1,9}",hours_op[i]))
}

或者更好的是，使用临时变量：

for (i in 1:length(txtfiles)){
    all_data <- readLines(txtfiles[i])
    temp <- all_data[hours_of_operation <- grep("Annual Hours of Operation:",all_data)]
    hours_op[i] <-regmatches(temp, regexpr("[0-9]{1,9}.[0-9]{1,9}",temp))
}

在 R 的循环中使用 grep、grepl 和 regexpr

问题描述

1 个解决方案

解决方案1
1 已采纳 2015-03-17 18:22:45

在 R 的循环中使用 grep、grepl 和 regexpr

问题描述

1 个解决方案

解决方案1 1 已采纳 2015-03-17 18:22:45

解决方案1
1 已采纳 2015-03-17 18:22:45