簡體   English   中英

無法檢查R中的文本語料庫

[英]Can't Inspect Text Corpus in R

我正在嘗試創建語料庫以進行進一步的分析,我正在顯示的代碼突然停止工作,並且我找不到該錯誤的解決方案。 我執行此:

library("tm")
library("SnowballC")
library("wordcloud")
library("arules")
library("arulesViz")
#library("e1071")

#WCZYTAJ_DANE######################################################################

setwd("D:/Dysk Google/Shared/SGGW/MGR_R2/Metody Eksploracji Danych/_PROJEKT")
smSPAM <- read.table("smSPAM.txt", sep="\t", quote="", stringsAsFactors = F)
dim(smSPAM)
colnames(smSPAM) <- c("class", 'text')
head(smSPAM,50)

#zamienia spam ham na 1 0
smSPAM$class=ifelse(smSPAM$class=="ham", "0", "1")
head(smSPAM$text,50)
#View(smSPAM[smSPAM$class=="1",])

#STWORZ_KORPUS#####################################################################

#tworze korpus na potrzeby documenttermmatrix
smSPAM.corp <- Corpus(VectorSource(smSPAM$text))
inspect(smSPAM.corp)

但我在日志中收到此錯誤:

Error in (function (classes, fdef, mtable):
unable to find an inherited method for function ‘inspect’ for signature ‘"VCorpus"’

但是,我仍然可以在該語料庫上執行詞干提取,刪除空格等操作,僅檢查不起作用。

好的,我發現了我的問題所在-tm和arules軟件包都包含檢查功能,我必須分離arulesViz和arules(按順序排列,因為前者需要后者),並且它再次正常工作。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM