R数据从结构化文件导入

Question

我有一个如下所示的txt文件：

year 1: ...
year 2: ...
....
....
[data]
1,2,3,4
3,4,5
3,5,6,7,8,9
...

所以基本上它会在[data]行之前有n行，而数据行下面的是我想读的内容。

我知道我可以手动删除标题，但如果我能让R检测到关键字[data]并读取之后的内容，那将是理想的。

有什么建议？

此外，正如您所看到的，我在每行上都有不同数量的变量用于实际数据。
有没有办法读取它，以保持线分离？

Answer 1

一种方法：

csvAfter <- function(file, marker="[data]", blank.lines.skip=FALSE) {
  lines <- readLines(file)
  i <- match(marker, lines)
  if (is.na(i)) {
    warning("Didn\'t find ", marker)
    return(NULL)
  }
  f <- textConnection(paste(lines[-(1:i)], collapse="\n"))
  on.exit(close(f), add=TRUE)
  return(read.csv(f, header=FALSE, fill=TRUE,
                  blank.lines.skip=blank.lines.skip))
}

例：

r <- "year 1: ...
year 2: ...
....
....
[data]
1,2,3,4
3,4,5
3,5,6,7,8,9"
print(csvAfter(textConnection(r)))

Answer 2

上述答案非常适合自动检测标志“[data]”，这将使其适用于数据前具有不同行数的输入文件。

如果您只需要执行此操作，则可以在read.csv或read.table的调用中包含“skip =”

例如，read.table（file，skip = n）

R数据从结构化文件导入

问题描述

2 个解决方案

解决方案1
4 2011-12-21 21:38:45

解决方案2
0 2011-12-23 17:39:38

R数据从结构化文件导入

问题描述

2 个解决方案

解决方案1 4 2011-12-21 21:38:45

解决方案2 0 2011-12-23 17:39:38

解决方案1
4 2011-12-21 21:38:45

解决方案2
0 2011-12-23 17:39:38