![](/img/trans.png)
[英]How to change language of termDocumentmatrix in R text-mining?
[英]How to convert a termDocumentMatrix which I have got from text mining in R into excel or CSV file?
更具体地说。 可以说我有一个带有以下元素的字符向量“名称”:
Names[1]<-"aaron, matt, patrick",
Names[2]<-"jiah, ron, melissa, john, patrick"
等等……我有22956个这样的元素。 我想分离所有名称,并在excel中为它们分配一个单独的列。 我该怎么做呢? 它需要文本挖掘。 但是我不确定该怎么做。
谢谢。
假设TDM as.matrix
您的需求,那么您应该能够使用as.matrix
函数将TDM对象强制转换为矩阵,然后照常导出到csv。
tdmMatrix <- as.matrix(myTDM)
write.csv(tdmMatrix, 'myfile.csv')
我假设您有一个由逗号分隔的字符串元素列表,其中元素数量不同。
Names <- c("aaron, matt, patrick",
"jiah, ron, melissa, john, patrick")
## get max number of elements
mm <- mm <- max(unlist(lapply(strsplit(Names,','),length)))
## set all rows the same length
lapply(strsplit(Names,','),function(x) {length(x) <- mm;x})
## create a data frame with the data welle formatted
res <- do.call(rbind,lapply(strsplit(Names,','),function(x) {length(x) <- mm;x}))
## save the file
write.csv(res,'output.csv')
我认为您也可以从plyr包中使用rbind.fill
,但是必须将每一行强制转换为data.frame
(一定的成本)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.