[英]How to remove 'English' words in tm_map?
tm_map
在处理文本挖掘时非常有用。 现在我要删除tm_map
文本中的“英语”单词。 任何人都可以教我如何编写语法(如removeNumbers
)?
一个选项可以是用户定义一个单词列表,或者更激进的是,将整个英语词典加载为一个单词列表。 在第一个删除单词的代码中,代码将是:
corp <- tm_map(corp, removeWords, c("will", "oxford",
"chart", "spain",
"economy", "expect",
"still", "rose", "fall"))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.