[英]R: Using regmatches to extract certain characters
我正在使用regmatches从代码中仅提取大写字母,但“”替换所有小写字母和数字。 有没有办法只提取大写字母而没有“”?
code <- c("clcopCow1zmstc0d87wnkig7OvdicpNuggvhryn92Gjuwczi8hqrfpRxs5Aj5dwpn0TanwoUwisdij7Lj8kpf03AT5Idr3coc0bt7yczjatOaootj55t3Nj3ne6c4Sfek.r1w1YwwojigOd6vrfUrbz2.2bkAnbhzgv4R9i05zEcrop.wAgnb.SqoU65fPa1otfb7wEm24k6t3sR9zqe5fy89n6Nd5t9kc4fE905gmc4Rgxo5nhDk!gr")
regmatches(code, gregexpr('[[:punct:]]*[[:upper:][:punct:]]*', code))
gsub("[^A-Z]", "", code)
# [1] "CONGRATULATIONSYOUAREASUPERNERD"
[^AZ]
很好,但是[^[:upper:]]
更好一些,因为它不会在特殊的语言环境中搞砸。
gsub("[^[:upper:]]", "", code)
为了获得更好的可读性(对于本示例来说可能stringr::str_extract
),您可能需要stringr::str_extract
,但是我不太确定如何做到这一点:
library(stringr)
str_c(str_extract_all(code,"[[:Lu:]]+")[[1]],collapse="")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.