簡體   English   中英

我如何在R中匹配此模式

[英]How do I match this pattern in R

我只需要在下面的模式中匹配第一個國家名稱。 國家名稱以所有大寫字母給出。 我使用以下代碼獲取匹配項,但它匹配所有國家。

'\\b[A-Z]{2,}.\\b'

例如:在下面的模式中,我只想要英國

x = "~ London, Greater London ~ UNITED KINGDOM;~ Ottawa, Ontario ~ CANADA;~,~ AUSTRALIA;~,~ POLAND;~,~ USA"

這似乎可行:

regmatches(x, regexpr('\\b[A-Z ]{2,}\\b', x))
# [1] "UNITED KINGDOM"

我只是添加了一個空格來設置字符集[AZ ] 請注意, regexpr獲得第一個匹配項,而gregexpr獲得所有匹配gregexpr (類似於sub vs gsub )。

有關更多信息,我建議使用?regexpr的官方文檔。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM