R stm包錯誤：“向量化的源必須具有正長度條目”

Question

我想我犯了一個非常簡單的錯誤，但我是R的新秀，我很難搞清楚。 我正在嘗試使用R中的'stm'包對我抓取的推文數據集進行一些主題建模。

數據集格式化為兩列，一列具有推文發送者的名稱，列標題為“元”，另一列具有推文的詞匯，列標題，“詞匯”。 運行下面的腳本后，我收到以下錯誤：

Error: is.Source(s) is not TRUE
In addition: Warning message:
In is.Source(s) : vectorized sources must have a positive length entry

library(stm)
library(igraph)
setwd("c:/Users/Adam/Desktop/RTwitter")

data <-read.csv("TweetDataSTM.csv")
processed <- textProcessor(data$documents, metadata = data)
out <- prepDocuments(processed$documents, processed$vocab, processed$meta)
docs <- out$documents
vocab <- out$vocab
meta <-out$meta

> library(stm)
> library(igraph)
> setwd("c:/Users/Adam/Desktop/RTwitter")
> 
> rm(list=ls())
> 
> data <-read.csv("TweetDataSTM.csv")
> processed <- textProcessor(data$documents, metadata = data)
Building corpus... 
Error: is.Source(s) is not TRUE
In addition: Warning message:
In is.Source(s) : vectorized sources must have a positive length entry
> out <- prepDocuments(processed$documents, processed$vocab, processed$meta)
Error in prepDocuments(processed$documents, processed$vocab, processed$meta) : 
  object 'processed' not found
> docs <- out$documents
Error: object 'out' not found
> vocab <- out$vocab
Error: object 'out' not found
> meta <-out$meta
Error: object 'out' not found

（任何建議將不勝感激！）

-亞當

Answer 1

我認為你的錯誤是因為你的專欄被命名為vocab和meta 。 但在這兒

已處理的< - textProcessor（數據$文檔，元數據=數據）

您試圖調用列documents - 據我所知 - 在您的data.frame中不存在。 嘗試將代碼更改為：

processed <- textProcessor(data$vocab, metadata = data)

R stm包錯誤：“向量化的源必須具有正長度條目”

問題描述

1 個解決方案

解決方案1
0 2019-04-18 12:40:46

R stm包錯誤：“向量化的源必須具有正長度條目”

問題描述

1 個解決方案

解決方案1 0 2019-04-18 12:40:46

解決方案1
0 2019-04-18 12:40:46