簡體   English   中英

如何刪除/替換 R 中字符串列中的特殊字符序列?

[英]How to delete/replace a sequence of special characters in a string column in R?

我得到了一個數據框(data.chem),其中包含一列字符串,在本例中為名稱。 我想從列中的某些字符串中刪除一系列特殊字符 (<U+034F>¨)。

由於前面步驟中的編碼錯誤,列中的一些觀察結果包含“<U+034F>¨”。我只想刪除這個序列而不損壞字符串的 rest。

我嘗試使用 gsub function,如下圖所示;

data.chem <- data.chem %>% mutate(clean_name=gsub("<U+034F>¨", "", name))

代碼運行,但是當我導出數據時,新列 clean_name 仍然包含包含序列 <U+034F>¨ 的字符串。

有誰知道處理這個問題的方法?

如果這是您要刪除的唯一序列,則可以使用gsub

mystring <- c("<U+034F>¨A", "<U+034F>¨B", "C", "<U+034F>¨2", "D<U+034F>¨", "E<U+034F>¨F")

gsub("[<U+034F>¨].", "", mystring)
#> [1] "A"  "B"  "C"  "2"  "D"  "EF"

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM