[英]Remove Telephone numbers using Regular Expressions in Python 3
我正在尝试从使用tika解析过的一堆文件中删除电话号码,但是我没有成功。
这是 regex101验证程序拍摄的屏幕截图 。 如您所见,电话号码被跳过。
以下是文本格式的相同示例:
“这里的东西
还有一些9,但是(我也有一些东西),123456,大家好!
+39.1234.325636 +39.321.1234567
男性| 生日1/12/16 | 国籍意大利
一些东西
这是我的正则表达式(我不是该领域的专家):
(\\(00\\d{2}\\)|\\(\\+\\d{2}\\)|00\\d{2}|\\+\\d{2})[\\. ]??3\\d{2}[\\. \\-]??\\d{2,4}[\\. \\-]??\\d{2,4}$
请注意,+ 39(或0039)是固定的,第二个电话号码中的前3个也是固定的。
你有什么建议吗? 非常感谢。
给定您的输入,这在regex101验证程序上对我有效: (\\+|00)39\\.[0-9]+\\.[0-9]+
这是另一个正则表达式/((?:\\+39)|(?:0039))+[0-9. ]+/gm
/((?:\\+39)|(?:0039))+[0-9. ]+/gm
。 这将有助于找到您的电话号码
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.