簡體   English   中英

R:使用regmatches提取某些字符

[英]R: Using regmatches to extract certain characters

我正在使用regmatches從代碼中僅提取大寫字母,但“”替換所有小寫字母和數字。 有沒有辦法只提取大寫字母而沒有“”?

code <- c("clcopCow1zmstc0d87wnkig7OvdicpNuggvhryn92Gjuwczi8hqrfpRxs5Aj5dwpn0TanwoUwisdij7Lj8kpf03AT5Idr3coc0bt7yczjatOaootj55t3Nj3ne6c4Sfek.r1w1YwwojigOd6vrfUrbz2.2bkAnbhzgv4R9i05zEcrop.wAgnb.SqoU65fPa1otfb7wEm24k6t3sR9zqe5fy89n6Nd5t9kc4fE905gmc4Rgxo5nhDk!gr")

regmatches(code, gregexpr('[[:punct:]]*[[:upper:][:punct:]]*', code))
gsub("[^A-Z]", "", code)
# [1] "CONGRATULATIONSYOUAREASUPERNERD"

[^AZ]很好,但是[^[:upper:]]更好一些,因為它不會在特殊的語言環境中搞砸。

gsub("[^[:upper:]]", "", code)

為了獲得更好的可讀性(對於本示例來說可能stringr::str_extract ),您可能需要stringr::str_extract ,但是我不太確定如何做到這一點:

library(stringr)
str_c(str_extract_all(code,"[[:Lu:]]+")[[1]],collapse="")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM