簡體   English   中英

正則表達式可檢測單詞縮寫

[英]Regex to detect word abbreviations

我目前正在使用CSV文件,該文件包含有關葡萄牙的行政區域和郵政編碼的信息,但是該文件未遵循任何嚴格的格式,這意味着有時整個字符串都大寫,並帶有其他問題。

我要解決的問題如下:在某些名稱的末尾有一個縮寫,與它的父級管理級別有關,我想刪除它。 據我所知,這是規則:

  1. 縮寫的長度不能超過3個字符(到目前為止,最多3個字符);
  2. 第一個字符可以是任何字母,不區分大小寫;
  3. 最后兩個字符始終是輔音(例如Z,B,M,P,..);
  4. (編輯)縮寫總是出現在字符串的最后一個單詞中;

(編輯2) -字符串始終為UTF-8

目的是從區域名稱中刪除此縮寫。

聽起來很簡單..

/\b[a-z][ZBMP]{2}\b/i

將匹配任何這樣描述的縮寫,向第二個字符類( [ZBMP] )添加字母以完成匹配。

僅當它不是另一個單詞的一部分時才匹配(這是\\b的工作)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM