[英]regex for extracting only alphabets and numbers in a string in R
嗨,我需要一個正則表達式來提取數字和(數字+字母)(如果存在於字符串中)。
例如:“ 4596 2B FC JAIN BHAWAN”->我希望將“ 4596 2B”作為我的輸出
> gsub("\\S([a-zA-Z])+\\S", "", "4596 2B FC JAIN BHAWAN")
[1] "4596 2B FC "
我不明白為什么上述正則表達式沒有用“”代替FC
任何幫助表示贊賞。 謝謝
您正在使用\\\\S
(大寫字母),表示“不是空格”,使用小寫字母,並且只能使用一次(因為字符串的結尾不以空格結尾):
gsub("\\s([a-zA-Z])+", "", "4596 2B FC JAIN BHAWAN")
使用西蒙的建議,我們可以看到樹木的樹林:
gsub("\\b[a-zA-Z]+\\b", "", "aa 4592 2B FC JAIN BHAWAN")
[1] " 4592 2B"
盡管我可能需要一些幫助來擺脫最初的空間。 (我可以只放嵌套的gsub
但這似乎很欺騙。)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.