簡體   English   中英

R編程-如何從數據集中刪除特殊字符?

[英]R programming - How to remove special characters from a data set?

我有一個包含字符串和特殊字符的數據集,例如可以在數據集中找到以下字符。

特殊字符

如何從數據集中刪除上述特殊字符?

使用正則表達式刪除不需要的字符,例如:

dataset$textcolumn <- gsub("[^\\w\\s]", "", dataset$textcolumn, perl=TRUE)

刪除除單詞字符和空格以外的所有內容。 要進行更復雜的替換,請查看幫助主題?regexp

還要查看編碼(此處的Encodingiconv很有用。),也許文本是正確的,但假定編碼錯誤。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM