繁体   English   中英

R:TermDocumentMatrix - 创建时出错

[英]R: TermDocumentMatrix - Error while creating

我正在尝试获取Twitter数据并创建wordcloud,但我的代码在创建TermDocumentMatrix时出错。 我的代码如下

twitter_search_data <- searchTwitter(searchString = text_to_search
                                    ,n = 500)

twitter_search_text <- sapply(twitter_search_data
                             ,function(x) x$getText())

twitter_search_corpus <- Corpus(VectorSource(twitter_search_text))

twitter_search_corpus <- tm_map(twitter_search_corpus, stripWhitespace, lazy = TRUE)

twitter_search_corpus <- tm_map(twitter_search_corpus, content_transformer(tolower), lazy = TRUE)

twitter_search_corpus <- tm_map(twitter_search_corpus, PlainTextDocument,lazy = TRUE)    

twitter_search_corpus <- tm_map(twitter_search_corpus, removePunctuation, lazy = TRUE)

twitter_search_corpus <- tm_map(twitter_search_corpus, removeNumbers, lazy = TRUE)

twitter_search_corpus <- tm_map(twitter_search_corpus, removeWords, c("the", "this", "The", "This", stopwords('english')), lazy = TRUE)

twitter_search_corpus <- tm_map(twitter_search_corpus, stemDocument, lazy = TRUE)

# Create Document Term Matrix 
tdm <- as.matrix(TermDocumentMatrix(twitter_search_corpus
                                   ,control=list(wordLengths=c(3,Inf))
                                   ))

创建TermDocumentMatrix之前没有错误。 我得到的错误如下

mclapply中的警告(x $ content [i],函数(d)tm_reduce(d,x $ lazy $ maps)):计划的核心1在用户代码中遇到错误,作业的所有值都将受到影响mclapply中的警告(unname( content(x)),termFreq,control):计划的核心1在用户代码中遇到错误,作业的所有值都将受到影响警告:UseMethod中的错误:没有适用于“meta”的方法应用于类的对象“try-错误“堆栈跟踪(最里面的第一个):74:有趣
73:拉普利
72:setNames
71:as.list.VCorpus
70:as.list
69:拉普利
68:meta.VCorpus
67:meta
66:TermDocumentMatrix.VCorpus
65:TermDocumentMatrix
64:as.matrix
63:observeEventHandler
1:runApp

我已经添加了lazy = TRUEcontent_transformer(tolower)但仍然会出现错误。

这个问题似乎与安置有关

twitter_search_corpus <- tm_map(twitter_search_corpus, stripWhitespace, lazy = TRUE)

删除标点后,在文本中插入数字和单词空格。 因此,删除空格的上述代码需要是创建TermDocumentMatrix之前的最后一条语句。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM