繁体   English   中英

从文件python创建一个字典

[英]create a dictionary from file python

我是 python 的新手,正在尝试读取一个文件并从中创建一个字典。 格式如下:

.1.3.6.1.4.1.14823.1.1.27 {
    TYPE = Switch
    VENDOR = Aruba
    MODEL = ArubaS3500-48T
    CERTIFICATION = CERTIFIED
    CONT = Aruba-Switch
    HEALTH = ARUBA-Controller
    VLAN = Dot1q    INSTRUMENTATION:
     Card-Fault            = ArubaController:DeviceID
     CPU/Memory            = ArubaController:DeviceID
     Environment              = ArubaSysExt:DeviceID
     Interface-Fault       = MIB2
     Interface-Performance = MIB2
     Port-Fault            = MIB2
     Port-Performance      = MIB2 
}

第一行 OID (.1.3.6.1.4.1.14823.1.1.27 { ) 我希望这是键,其余行是值,直到 }

我尝试了一些组合,但无法获得正确的正则表达式来匹配这些

请问有什么帮助吗?

我试过类似的东西

lines = cache.readlines()

for line in lines:

    searchObj = re.search(r'(^.\d.*{)(.*)$', line)

    if searchObj:
        (oid, cert ) = searchObj.groups()

    results[searchObj(oid)] = ", ".join(line[1:])

    print("searchObj.group() : ", searchObj.group(1))

    print("searchObj.group(1) : ", searchObj.group(2))

你可以试试这个:

import re
data = open('filename.txt').read()
the_key = re.findall("^\n*[\.\d]+", data)
values = [re.split("\s+\=\s+", i) for i in re.findall("[a-zA-Z0-9]+\s*\=\s*[a-zA-Z0-9]+", data)]
final_data = {the_key[0]:dict(values)}

输出:

{'\n.1.3.6.1.4.1.14823.1.1.27': {'VENDOR': 'Aruba', 'CERTIFICATION': 'CERTIFIED', 'Fault': 'MIB2', 'VLAN': 'Dot1q', 'Environment': 'ArubaSysExt', 'HEALTH': 'ARUBA', 'Memory': 'ArubaController', 'Performance': 'MIB2', 'CONT': 'Aruba', 'MODEL': 'ArubaS3500', 'TYPE': 'Switch'}}

您可以使用嵌套的 dict 理解以及外部和内部正则表达式。


你的块可以用

^\s*                 # start of line + whitespaces, eventually
(?P<key>\.[\d.]+)\s* # the key
{(?P<values>[^{}]+)} # everything between { and }

就正则表达式而言,这可以表述为

^\\s* # start of line + whitespaces, eventually (?P<key>\\.[\\d.]+)\\s* # the key {(?P<values>[^{}]+)} # everything between { and }

如您所见,我们将这些部分拆分为键/值对。


你的“内部”结构可以这样表述

rx_outer = re.compile(r'^\s*(?P<key>\.[\d.]+)\s*{(?P<values>[^{}]+)}', re.MULTILINE)
rx_inner = re.compile(r'(?P<key>\b[A-Z][-/\w]+\b)\s*=\s*(?P<value>.+)')

result = {item.group('key'): 
    {match.group('key'): match.group('value') 
    for match in rx_inner.finditer(item.group('values'))} 
    for item in rx_outer.finditer(string)}
print(result)


现在让我们一起构建“外部”和“内部”表达式:

 rx_outer = re.compile(r'^\\s*(?P<key>\\.[\\d.]+)\\s*{(?P<values>[^{}]+)}', re.MULTILINE) rx_inner = re.compile(r'(?P<key>\\b[AZ][-/\\w]+\\b)\\s*=\\s*(?P<value>.+)') result = {item.group('key'): {match.group('key'): match.group('value') for match in rx_inner.finditer(item.group('values'))} for item in rx_outer.finditer(string)} print(result)

可以在 ideone.com 上找到演示

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM