繁体   English   中英

如何从嵌套字典创建平面字典,其字符串是引用字典的子集?

[英]How can I create a flat dictionary from a nested dictionary whose keys are a subset of a reference dictionary?

我正在创建一个嵌套的引用字典来记录数据字典可能具有的所有可能的键以及相应的值,这些值是在平面字典中使用的所有键。

数据字典的键将始终是参考字典的键的子集。 平面字典的键将始终是参考字典的值集的子集。

换句话说,给定一个带有这样的赋值的引用字典:

reference['agent']['address'] = 'agentaddress'
reference['agent']['zone']['id'] = 'agentzoneid'
reference['eventid'] = 'eventid'
reference['file']['hash'] = 'filehash'
reference['file']['name'] = 'filename'

和一个像这样的赋值的数据字典:

nested['agent']['address'] = '172.16.16.16'
nested['eventid'] = '1234566778'
nested['file']['name'] = 'reallybadfile.exe'

代码应该生成一个可以像这样分配的字典:

flat['agentaddress'] = '172.16.16.16'
flat['eventid'] = '1234566778'
flat['filename'] = 'reallybadfile.exe'

我永远不会知道嵌套字典中的哪些字段将被填充,哪些字段不会填充,但我可以知道参考字典中的映射。

我希望我需要使用递归来将字典遍历到子字典中,并且可能需要某种间接来分别从引用字典值和嵌套字典键创建扁平字典键和值。

但是,我还没有能够生成任何有意义的代码。

也许从很高的层面看,它可能看起来像这样:

def this(ref, nest, flat, *args):
    for (k,v) in reference:
        if type(v) is dict:
            this(?, ?, ?, ?)
        elif nested[path][to][k]:      
            flat[reference[path][to][k]] = nested[path][to][k]

其中[path][to][k]代表了一些做间接的方法, *args是我传递给递归函数的东西,所以我有办法让上下文足以通过字典的嵌套来实现我需要的键和值的引用。

使用生成器 ,这是相当直接的:

码:

def make_flat_tuples(data, ref):
    for k, v in data.items():
        if isinstance(v, dict):
            for x in make_flat_tuples(v, ref[k]):
                yield x
        else:
            yield ref[k], v

flat = dict(make_flat_tuples(nested, reference))

测试代码:

from collections import defaultdict

reference = defaultdict(dict)
reference['agent'] = defaultdict(dict)

reference['agent']['address'] = 'agentaddress'
reference['agent']['zone']['id'] = 'agentzoneid'
reference['eventid'] = 'eventid'
reference['file']['hash'] = 'filehash'
reference['file']['name'] = 'filename'

nested = defaultdict(dict)

nested['agent']['address'] = '172.16.16.16'
nested['eventid'] = '1234566778'
nested['file']['name'] = 'reallybadfile.exe'

print(dict(make_flat_tuples(nested, reference)))

结果:

{
    'agentaddress': '172.16.16.16', 
    'eventid': '1234566778', 
    'filename': 'reallybadfile.exe'
}

@StephenRauch答案很好,如果你不想使用生成器,只需重新格式化如下:

# r=reference, n=nested, f=final
def buildDict(r, n, f):
    for key in n.keys():
        if isinstance(n[key], dict):
            buildDict(r.get(key), n[key], f)
        else:
            if r.get(key):
                f[r.get(key)] = n[key]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM