将多个.txt 文件导入 r

Question

我需要将多个.txt 文件导入 R。 每个文件中都有多个句子（例如，“星期一，我去了公园。”）我希望能够同时导入所有文件，然后将它们添加到 tibble，这样我可以对其进行文本分析。

到目前为止，我已经尝试过

#to create vector of txt files
files <- list.files(pattern = "txt$")

# Read all the files and create a FileName column to store filenames
files_list <- files %>%
  set_names(.) %>%
  map_df(read_table2, .id = "FileName")

my_data <- read.delim(file(files))

但我不知道如何将 each.txt 文件中的文本实际加载到数据中。 当我在上面运行此代码时，它仅从其中一个文件中读取文本，而不是全部。

我也试过：

sapply(files, read.delim)
mainlist = list()
for (i in 1: length(fileList)) {
  mainlist[[i]] = read.delim(files[i], header = TRUE, sep = "\t")
}

虽然它会打印出 each.txt 文件中的所有信息，但当我尝试使用

mainlist_tib <- tibble(mainlist)

小标题是空的。

任何帮助将不胜感激！

编辑：关于 tibble，我希望它有一列用于 txt 文件名，然后是另一列用于文件中的文本，然后能够使用unnest_tokens() function 在每一行都有一个 tibble只包含一个词。 有点像 Silge 和 Robinson 的文本挖掘教科书中的示例： https://www.tidytextmining.com/tidytext.html

Answer 1

你可以这样尝试：

library(dplyr)
library(purrr)

files %>%
  set_names(.) %>%
  map_dfr(~readr::read_table(., col_names = F), .id = "FileName")

将多个.txt 文件导入 r

问题描述

1 个解决方案

解决方案1
0 2022-09-01 12:54:15

将多个.txt 文件导入 r

问题描述

1 个解决方案

解决方案1 0 2022-09-01 12:54:15

解决方案1
0 2022-09-01 12:54:15