繁体   English   中英

使用R在一个语料库中合并两个单词

[英]Combine two words in a corpus using R

我正在尝试使用content_transform函数将两个单词组合成一个单词,作为R中tm包的一部分。

例如,我有位置数据并创建词云,我需要组合“ san jose”,“ san diego”,“ san francisco”),否则,“ san”是最常见的词。

就我所知,正在创建一个函数,例如,

combineUK <- content_transformer(function(x, pattern)     
gsub(pattern,"UK",x,ignore.case = T))

但是,为每个城镇分别创建功能是不现实的。

我想知道是否可以在content_transform实现paste()函数吗?

因此,也许我缺少明显的东西。

由于您没有提供完整的可复制示例(可复制粘贴运行),因此我不知道您得到了什么以及想要什么。 但是,考虑一下

library(tm)
library(wordcloud)
par(mfrow = c(2,1), cex=.5)
txt <- c("hello san jose dudes", "welcome to san diego", "Did you like san francisco")
corp <- Corpus(VectorSource(txt))
wordcloud(corp, min.freq=1)
corp <- tm_map(corp, content_transformer(function(x) gsub("(san).(\\w+)", "\\1\\2", x, ignore.case = TRUE)))
wordcloud(corp, min.freq=1)

在此处输入图片说明

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM