[英]Regex to detect word abbreviations
我目前正在使用CSV文件,該文件包含有關葡萄牙的行政區域和郵政編碼的信息,但是該文件未遵循任何嚴格的格式,這意味着有時整個字符串都大寫,並帶有其他問題。
我要解決的問題如下:在某些名稱的末尾有一個縮寫,與它的父級管理級別有關,我想刪除它。 據我所知,這是規則:
(編輯2) -字符串始終為UTF-8
目的是從區域名稱中刪除此縮寫。
聽起來很簡單..
/\b[a-z][ZBMP]{2}\b/i
將匹配任何這樣描述的縮寫,向第二個字符類( [ZBMP]
)添加字母以完成匹配。
僅當它不是另一個單詞的一部分時才匹配(這是\\b
的工作)。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.