[英]pick up string with specific pattern in R using gsub
"CATARACT; #大腿骨~2010"
我需要拿起大腿骨
在使用gsub
R中,實際上是unicode,以&#
開頭,后跟五位數字,然后以;
結尾;
。
我知道如何使用以下方法擺脫這些unicode:
gsub("&#[0-9]+;","","CATARACT; #大腿骨~2010")
但是如何使用gsub
保留這些unicode?
我想要的輸出是大腿骨
。
感謝您的回答,但是如果模式不總是這樣,那么無論它們在哪里,我都需要提取unicode:
"CATARACT; #大腿骨~2010;CATARACT; #夨膀骩~2010"
例如使用gregexpr
和regmatches
:
ex <- "CATARACT; #大腿骨~2010;CATARACT; #夨膀骩~2010"
m <- gregexpr("&#[0-9]+;", ex)
(r <- regmatches(ex, m))
# [[1]]
# [1] "大" "腿" "骨" "夨" "膀" "骩"
paste(r[[1]], collapse="")
# [1] "大腿骨夨膀骩"
你可以試試 :
gsub("(^\\D*)((&#[0-9]+;)+)(.*$)", "\\2", x)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.