繁体   English   中英

R编程-如何从数据集中删除特殊字符?

[英]R programming - How to remove special characters from a data set?

我有一个包含字符串和特殊字符的数据集,例如可以在数据集中找到以下字符。

特殊字符

如何从数据集中删除上述特殊字符?

使用正则表达式删除不需要的字符,例如:

dataset$textcolumn <- gsub("[^\\w\\s]", "", dataset$textcolumn, perl=TRUE)

删除除单词字符和空格以外的所有内容。 要进行更复杂的替换,请查看帮助主题?regexp

还要查看编码(此处的Encodingiconv很有用。),也许文本是正确的,但假定编码错误。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM