如何刪除/替換 R 中字符串列中的特殊字符序列？

Question

我得到了一個數據框（data.chem），其中包含一列字符串，在本例中為名稱。 我想從列中的某些字符串中刪除一系列特殊字符 (<U+034F>¨)。

由於前面步驟中的編碼錯誤，列中的一些觀察結果包含“<U+034F>¨”。我只想刪除這個序列而不損壞字符串的 rest。

我嘗試使用 gsub function，如下圖所示；

data.chem <- data.chem %>% mutate(clean_name=gsub("<U+034F>¨", "", name))

代碼運行，但是當我導出數據時，新列 clean_name 仍然包含包含序列 <U+034F>¨ 的字符串。

有誰知道處理這個問題的方法？

Answer 1

如果這是您要刪除的唯一序列，則可以使用gsub 。

mystring <- c("<U+034F>Â¨A", "<U+034F>Â¨B", "C", "<U+034F>Â¨2", "D<U+034F>Â¨", "E<U+034F>Â¨F")

gsub("[<U+034F>Â¨].", "", mystring)
#> [1] "A"  "B"  "C"  "2"  "D"  "EF"

如何刪除/替換 R 中字符串列中的特殊字符序列？

問題描述

1 個解決方案

解決方案1
1 2021-12-13 17:57:13

如何刪除/替換 R 中字符串列中的特殊字符序列？

問題描述

1 個解決方案

解決方案1 1 2021-12-13 17:57:13

解決方案1
1 2021-12-13 17:57:13