[英]Combine two words in a corpus using R
我正在尝试使用content_transform
函数将两个单词组合成一个单词,作为R中tm
包的一部分。
例如,我有位置数据并创建词云,我需要组合“ san jose”,“ san diego”,“ san francisco”),否则,“ san”是最常见的词。
就我所知,正在创建一个函数,例如,
combineUK <- content_transformer(function(x, pattern)
gsub(pattern,"UK",x,ignore.case = T))
但是,为每个城镇分别创建功能是不现实的。
我想知道是否可以在content_transform
实现paste()
函数吗?
因此,也许我缺少明显的东西。
由于您没有提供完整的可复制示例(可复制粘贴运行),因此我不知道您得到了什么以及想要什么。 但是,考虑一下
library(tm)
library(wordcloud)
par(mfrow = c(2,1), cex=.5)
txt <- c("hello san jose dudes", "welcome to san diego", "Did you like san francisco")
corp <- Corpus(VectorSource(txt))
wordcloud(corp, min.freq=1)
corp <- tm_map(corp, content_transformer(function(x) gsub("(san).(\\w+)", "\\1\\2", x, ignore.case = TRUE)))
wordcloud(corp, min.freq=1)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.