繁体   English   中英

无法检查R中的文本语料库

[英]Can't Inspect Text Corpus in R

我正在尝试创建语料库以进行进一步的分析,我正在显示的代码突然停止工作,并且我找不到该错误的解决方案。 我执行此:

library("tm")
library("SnowballC")
library("wordcloud")
library("arules")
library("arulesViz")
#library("e1071")

#WCZYTAJ_DANE######################################################################

setwd("D:/Dysk Google/Shared/SGGW/MGR_R2/Metody Eksploracji Danych/_PROJEKT")
smSPAM <- read.table("smSPAM.txt", sep="\t", quote="", stringsAsFactors = F)
dim(smSPAM)
colnames(smSPAM) <- c("class", 'text')
head(smSPAM,50)

#zamienia spam ham na 1 0
smSPAM$class=ifelse(smSPAM$class=="ham", "0", "1")
head(smSPAM$text,50)
#View(smSPAM[smSPAM$class=="1",])

#STWORZ_KORPUS#####################################################################

#tworze korpus na potrzeby documenttermmatrix
smSPAM.corp <- Corpus(VectorSource(smSPAM$text))
inspect(smSPAM.corp)

但我在日志中收到此错误:

Error in (function (classes, fdef, mtable):
unable to find an inherited method for function ‘inspect’ for signature ‘"VCorpus"’

但是,我仍然可以在该语料库上执行词干提取,删除空格等操作,仅检查不起作用。

好的,我发现了我的问题所在-tm和arules软件包都包含检查功能,我必须分离arulesViz和arules(按顺序排列,因为前者需要后者),并且它再次正常工作。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM