[英]how to remove special characters and number patterns from a string in R
我有一個字符串"<U+7F85><U+934F><U+6DC7> <U+2730> Sascha Banks"
我想排除名稱"Sacha Banks"
以外的所有內容。
我執行:
name1<-c("<U+7F85><U+934F><U+6DC7> <U+2730> Sascha Banks ")
name2<-str_replace_all(name1, "[^[:alnum:]]", " ")
實際輸出: " U 7F85 U 934F U 6DC7 U 2730 Sascha Banks "
預期產出: " Sascha Banks "
請糾正我。
嘗試
x <- "<U+7F85><U+934F><U+6DC7> <U+2730> Sascha Banks"
gsub("(<.*>)", "", x)
## [1] " Sascha Banks"
嘗試
gsub("<[^>]*>", "", name1)
## [1] " Sascha Banks "
如果您不願意學習正則表達式,這是一種非常簡單的方法,它刪除了所有尖括號:
library(qdap)
bracketX("<U+7F85><U+934F><U+6DC7> <U+2730> Sascha Banks", "angle")
## [1] "Sascha Banks"
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.