簡體   English   中英

R stm包錯誤:“向量化的源必須具有正長度條目”

[英]R stm package error: “vectorized sources must have a positive length entry”

我想我犯了一個非常簡單的錯誤,但我是R的新秀,我很難搞清楚。 我正在嘗試使用R中的'stm'包對我抓取的推文數據集進行一些主題建模。

數據集格式化為兩列,一列具有推文發送者的名稱,列標題為“元”,另一列具有推文的詞匯,列標題,“詞匯”。 運行下面的腳本后,我收到以下錯誤:

Error: is.Source(s) is not TRUE
In addition: Warning message:
In is.Source(s) : vectorized sources must have a positive length entry

library(stm)
library(igraph)
setwd("c:/Users/Adam/Desktop/RTwitter")

data <-read.csv("TweetDataSTM.csv")
processed <- textProcessor(data$documents, metadata = data)
out <- prepDocuments(processed$documents, processed$vocab, processed$meta)
docs <- out$documents
vocab <- out$vocab
meta <-out$meta

> library(stm)
> library(igraph)
> setwd("c:/Users/Adam/Desktop/RTwitter")
> 
> rm(list=ls())
> 
> data <-read.csv("TweetDataSTM.csv")
> processed <- textProcessor(data$documents, metadata = data)
Building corpus... 
Error: is.Source(s) is not TRUE
In addition: Warning message:
In is.Source(s) : vectorized sources must have a positive length entry
> out <- prepDocuments(processed$documents, processed$vocab, processed$meta)
Error in prepDocuments(processed$documents, processed$vocab, processed$meta) : 
  object 'processed' not found
> docs <- out$documents
Error: object 'out' not found
> vocab <- out$vocab
Error: object 'out' not found
> meta <-out$meta
Error: object 'out' not found

(任何建議將不勝感激!)

-亞當

我認為你的錯誤是因為你的專欄被命名為vocabmeta 但在這兒

已處理的< - textProcessor(數據$文檔,元數據=數據)

您試圖調用列documents - 據我所知 - 在您的data.frame中不存在。 嘗試將代碼更改為:

processed <- textProcessor(data$vocab, metadata = data)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM