[英]Remove Telephone numbers using Regular Expressions in Python 3
我正在嘗試從使用tika解析過的一堆文件中刪除電話號碼,但是我沒有成功。
這是 regex101驗證程序拍攝的屏幕截圖 。 如您所見,電話號碼被跳過。
以下是文本格式的相同示例:
“這里的東西
還有一些9,但是(我也有一些東西),123456,大家好!
+39.1234.325636 +39.321.1234567
男性| 生日1/12/16 | 國籍意大利
一些東西
這是我的正則表達式(我不是該領域的專家):
(\\(00\\d{2}\\)|\\(\\+\\d{2}\\)|00\\d{2}|\\+\\d{2})[\\. ]??3\\d{2}[\\. \\-]??\\d{2,4}[\\. \\-]??\\d{2,4}$
請注意,+ 39(或0039)是固定的,第二個電話號碼中的前3個也是固定的。
你有什么建議嗎? 非常感謝。
給定您的輸入,這在regex101驗證程序上對我有效: (\\+|00)39\\.[0-9]+\\.[0-9]+
這是另一個正則表達式/((?:\\+39)|(?:0039))+[0-9. ]+/gm
/((?:\\+39)|(?:0039))+[0-9. ]+/gm
。 這將有助於找到您的電話號碼
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.