[英]How to delete/replace a sequence of special characters in a string column in R?
我得到了一個數據框(data.chem),其中包含一列字符串,在本例中為名稱。 我想從列中的某些字符串中刪除一系列特殊字符 (<U+034F>¨)。
由於前面步驟中的編碼錯誤,列中的一些觀察結果包含“<U+034F>¨”。我只想刪除這個序列而不損壞字符串的 rest。
我嘗試使用 gsub function,如下圖所示;
data.chem <- data.chem %>% mutate(clean_name=gsub("<U+034F>¨", "", name))
代碼運行,但是當我導出數據時,新列 clean_name 仍然包含包含序列 <U+034F>¨ 的字符串。
有誰知道處理這個問題的方法?
如果這是您要刪除的唯一序列,則可以使用gsub
。
mystring <- c("<U+034F>¨A", "<U+034F>¨B", "C", "<U+034F>¨2", "D<U+034F>¨", "E<U+034F>¨F")
gsub("[<U+034F>¨].", "", mystring)
#> [1] "A" "B" "C" "2" "D" "EF"
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.