[英]R programming - How to remove special characters from a data set?
使用正則表達式刪除不需要的字符,例如:
dataset$textcolumn <- gsub("[^\\w\\s]", "", dataset$textcolumn, perl=TRUE)
刪除除單詞字符和空格以外的所有內容。 要進行更復雜的替換,請查看幫助主題?regexp
。
還要查看編碼(此處的Encoding
和iconv
很有用。),也許文本是正確的,但假定編碼錯誤。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.