繁体   English   中英

如何删除 tm_map 中的“英文”字样?

[英]How to remove 'English' words in tm_map?

tm_map在处理文本挖掘时非常有用。 现在我要删除tm_map文本中的“英语”单词。 任何人都可以教我如何编写语法(如removeNumbers )?

一个选项可以是用户定义一个单词列表,或者更激进的是,将整个英语词典加载为一个单词列表。 在第一个删除单词的代码中,代码将是:

corp <- tm_map(corp, removeWords, c("will", "oxford",
                                    "chart", "spain",
                                    "economy", "expect", 
                                    "still", "rose", "fall"))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM