[英]How do I match this pattern in R
我只需要在下面的模式中匹配第一個國家名稱。 國家名稱以所有大寫字母給出。 我使用以下代碼獲取匹配項,但它匹配所有國家。
'\\b[A-Z]{2,}.\\b'
例如:在下面的模式中,我只想要英國
x = "~ London, Greater London ~ UNITED KINGDOM;~ Ottawa, Ontario ~ CANADA;~,~ AUSTRALIA;~,~ POLAND;~,~ USA"
這似乎可行:
regmatches(x, regexpr('\\b[A-Z ]{2,}\\b', x))
# [1] "UNITED KINGDOM"
我只是添加了一個空格來設置字符集[AZ ]
。 請注意, regexpr
獲得第一個匹配項,而gregexpr
獲得所有匹配gregexpr
(類似於sub
vs gsub
)。
有關更多信息,我建議使用?regexpr
的官方文檔。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.