簡體   English   中英

正則表達式用於僅提取R中字符串中的字母和數字

[英]regex for extracting only alphabets and numbers in a string in R

嗨,我需要一個正則表達式來提取數字和(數字+字母)(如果存在於字符串中)。

例如:“ 4596 2B FC JAIN BHAWAN”->我希望將“ 4596 2B”作為我的輸出

> gsub("\\S([a-zA-Z])+\\S", "", "4596 2B FC JAIN BHAWAN")
[1] "4596 2B FC  "

我不明白為什么上述正則表達式沒有用“”代替FC

任何幫助表示贊賞。 謝謝

您正在使用\\\\S (大寫字母),表示“不是空格”,使用小寫字母,並且只能使用一次(因為字符串的結尾不以空格結尾):

gsub("\\s([a-zA-Z])+", "", "4596 2B FC JAIN BHAWAN")

使用西蒙的建議,我們可以看到樹木的樹林:

gsub("\\b[a-zA-Z]+\\b", "", "aa 4592 2B FC JAIN BHAWAN")
[1] " 4592 2B"

盡管我可能需要一些幫助來擺脫最初的空間。 (我可以只放嵌套的gsub但這似乎很欺騙。)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM