簡體   English   中英

將多個.txt 文件導入 r

[英]Importing multiple .txt files into r

我需要將多個.txt 文件導入 R。 每個文件中都有多個句子(例如,“星期一,我去了公園。”)我希望能夠同時導入所有文件,然后將它們添加到 tibble,這樣我可以對其進行文本分析。

到目前為止,我已經嘗試過

#to create vector of txt files
files <- list.files(pattern = "txt$")

# Read all the files and create a FileName column to store filenames
files_list <- files %>%
  set_names(.) %>%
  map_df(read_table2, .id = "FileName")
my_data <- read.delim(file(files))

但我不知道如何將 each.txt 文件中的文本實際加載到數據中。 當我在上面運行此代碼時,它僅從其中一個文件中讀取文本,而不是全部。

我也試過:

sapply(files, read.delim)
mainlist = list()
for (i in 1: length(fileList)) {
  mainlist[[i]] = read.delim(files[i], header = TRUE, sep = "\t")
}

雖然它會打印出 each.txt 文件中的所有信息,但當我嘗試使用

mainlist_tib <- tibble(mainlist)

小標題是空的。

任何幫助將不勝感激!

編輯:關於 tibble,我希望它有一列用於 txt 文件名,然后是另一列用於文件中的文本,然后能夠使用unnest_tokens() function 在每一行都有一個 tibble只包含一個詞。 有點像 Silge 和 Robinson 的文本挖掘教科書中的示例: https://www.tidytextmining.com/tidytext.html

你可以這樣嘗試:

library(dplyr)
library(purrr)

files %>%
  set_names(.) %>%
  map_dfr(~readr::read_table(., col_names = F), .id = "FileName")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM