使用python从文本文件解析IP地址/网络

Question

我有以下文本文件，在解析IP地址时需要一些帮助。

文本文件的格式为

abc 10.1.1.1/32   aabbcc
def 11.2.0.0/16   eeffgg
efg 0.0.0.0/0   ddeeff

换句话说，一堆IP网络作为日志文件的一部分存在。 输出应如下所示：

10.1.1.1/32
11.2.0.0/16
0.0.0.0/0

我有以下代码，但未输出所需信息

file = open(filename, 'r')
for eachline in file.readlines():
    ip_regex = re.findall(r'(?:\d{1,3}\.){3}\d{1,3}', eachline)
    print ip_regex

Answer 1

首先，您的正则表达式甚至不会尝试捕获除了四个点分数字以外的任何内容，因此，它当然不会与其他任何内容匹配，例如最后一个/32 。 如果仅在末尾添加/\\d{1,2} ，它将解决以下问题：

(?:\d{1,3}\.){3}\d{1,3}/\d{1,2}

正则表达式可视化

Debuggex演示

但是，如果您对正则表达式的理解不够深入，则可能不应该将正则表达式用作永远无法调试或扩展的“魔术”。 str方法（例如split或find更加冗长，但对于新手而言可能更容易理解：

for line in file:
    for part in line.split()
        try:
            address, network = part.split('/')
            a, b, c, d = address.split('.')
        except ValueError:
            pass # not in the right format
        else:
            # do something with part, or address and network, or whatever

附带说明一下，根据您实际使用这些东西的情况，您可能需要使用ipaddress模块（或2.6-3.2的PyPI上的反向端口），而不是字符串解析：

>>> import ipaddress
>>> s = '10.1.1.1/32'
>>> a = ipaddress.ip_network('10.1.1.1/32')

您可以将其与以上任何一种结合使用：

for line in file:
    for part in line.split():
        try:
            a = ipaddress.ip_network(part)
        except ValueError:
            pass # not the right format
        else:
            # do something with a and its nifty methods

Answer 2

在这种情况下，正则表达式可能会过大，您可以使用split

with open(filename) as f:
    ipList = [line.split()[1] for line in f]

这将产生一个字符串列表，即IP地址。

使用python从文本文件解析IP地址/网络

问题描述

2 个解决方案

解决方案1
5 已采纳 2014-10-14 21:14:48

解决方案2
1 2014-10-14 21:09:08

使用python从文本文件解析IP地址/网络

问题描述

2 个解决方案

解决方案1 5 已采纳 2014-10-14 21:14:48

解决方案2 1 2014-10-14 21:09:08

解决方案1
5 已采纳 2014-10-14 21:14:48

解决方案2
1 2014-10-14 21:09:08