簡體   English   中英

如何從R中的字符串中刪除特殊字符和數字模式

[英]how to remove special characters and number patterns from a string in R

我有一個字符串"<U+7F85><U+934F><U+6DC7> <U+2730> Sascha Banks"

我想排除名稱"Sacha Banks"以外的所有內容。

我執行:

name1<-c("<U+7F85><U+934F><U+6DC7> <U+2730> Sascha Banks ")
name2<-str_replace_all(name1, "[^[:alnum:]]", " ")

實際輸出: " U 7F85 U 934F U 6DC7 U 2730 Sascha Banks "

預期產出: " Sascha Banks "

請糾正我。

嘗試

x <- "<U+7F85><U+934F><U+6DC7> <U+2730> Sascha Banks"
gsub("(<.*>)", "", x)
## [1] " Sascha Banks"

嘗試

gsub("<[^>]*>", "", name1)
## [1] "  Sascha Banks "

如果您不願意學習正則表達式,這是一種非常簡單的方法,它刪除了所有尖括號:

library(qdap)
bracketX("<U+7F85><U+934F><U+6DC7> <U+2730> Sascha Banks", "angle")

## [1] "Sascha Banks"

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM