[英]R programming - How to remove special characters from a data set?
使用正则表达式删除不需要的字符,例如:
dataset$textcolumn <- gsub("[^\\w\\s]", "", dataset$textcolumn, perl=TRUE)
删除除单词字符和空格以外的所有内容。 要进行更复杂的替换,请查看帮助主题?regexp
。
还要查看编码(此处的Encoding
和iconv
很有用。),也许文本是正确的,但假定编码错误。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.