使用R中的readxl包从excel文件的某些行开始读取特定列

Question

我正在尝试将excel文件读入R。我需要从第5行开始读取A列和C列（无B）。这是我所做的：

library(readxl)

read_excel('./data/temp.xlsx',  skip=5,
            range=cell_cols(c('A', 'C')))

上面的代码不起作用。 首先，它不会跳过5行。 它从第一行读取。 其次，它也读了B列，我不想。

有人知道我做错了吗？ 我知道如何指定单元格范围，但是如何选择所需的特定列呢？

Answer 1

您可以使用column_types参数（检查?read_excel ）来跳过被读取的列。 例如，如果列A和C是数字：

readxl::read_excel("/path/to/data.xlsx", 
    col_names = FALSE, 
    skip = 5, 
    col_types=c("numeric", "skip", "numeric"))

注意：如果最初不知道列类型，则可以将其读取为文本，然后进行转换。

Answer 2

从readxl.tidyverse.org借阅内容。 关于为什么还要添加B列的问题之一是因为：

## columns only
read_excel(..., range = cell_cols(1:26))
## is equivalent to all of these
read_excel(..., range = cell_cols(c(1, 26)))
read_excel(..., range = cell_cols("A:Z"))
read_excel(..., range = cell_cols(LETTERS))
read_excel(..., range = cell_cols(c("A", "Z"))

因此， cell_cols("A:C")等同于cell_cols(c("A", "C"))

以前，我在一个项目中所做的工作如下。 我猜您可以调整以下内容并按列提取数据，然后将它们合并在一起。

ranges = list("A5:H18", "A28:H39", "A50:H61")

extracted <- lapply(ranges, function(each_range){
                read_excel(filepath, sheet = 1, range = each_range, na = c("", "-"), col_names = cname, col_types = ctype)
        }) %>%
                reduce(full_join)

关于您关于跳过行的问题，我也不确定，因为我也在搜索此答案，并在stackoverflow上找到了您的问题。

[编辑]我想我在https://github.com/tidyverse/readxl/issues/577上找到了一些读物。 无论如何，如果您使用range ，则不能执行任何skip ，因为range优先于skip和其他

使用R中的readxl包从excel文件的某些行开始读取特定列

问题描述

2 个解决方案

解决方案1
1 2019-06-22 08:38:14

解决方案2
0 2019-07-12 02:36:48

使用R中的readxl包从excel文件的某些行开始读取特定列

问题描述

2 个解决方案

解决方案1 1 2019-06-22 08:38:14

解决方案2 0 2019-07-12 02:36:48

解决方案1
1 2019-06-22 08:38:14

解决方案2
0 2019-07-12 02:36:48