如何從字典列表中過濾並寫入文件？

Question

打印（標簽列表）

[[{'script': [{'domain': 'random.com', 'path': 'js/custom.js'}]},
 {'script': [{'domain': 'cdnjs.cloudflare.com',
              'path': '/ajax/libs/fancybox/2.1.5/jquery.fancybox.min.js'}]},
 {'link': [{'domain': 'random.com', 'path': 'css/bootstrap.min.css'}]},
 {'link': [{'domain': 'random.com', 'path': 'css/style.css'}]},
 {'link': [{'domain': 'random.com', 'path': 'css/responsive.css'}]},
 {'link': [{'domain': 'random.com',
            'path': 'css/jquery.mCustomScrollbar.min.css'}]},
 {'link': [{'domain': 'netdna.bootstrapcdn.com',
            'path': '/font-awesome/4.0.3/css/font-awesome.css'}]}]]

我想獲取'domain'鍵中的所有數據，並將它們domain.txt存儲在新文件domain.txt 。

域名.txt

random.com
cdnjs.cloudfare.com
netdna.bootstrapcdn.com

應避免重復。

Answer 1

一種方法：

data = [[{'script': [{'domain': 'random.com', 'path': 'js/custom.js'}]},
         {'script': [{'domain': 'cdnjs.cloudflare.com',
                      'path': '/ajax/libs/fancybox/2.1.5/jquery.fancybox.min.js'}]},
         {'link': [{'domain': 'random.com', 'path': 'css/bootstrap.min.css'}]},
         {'link': [{'domain': 'random.com', 'path': 'css/style.css'}]},
         {'link': [{'domain': 'random.com', 'path': 'css/responsive.css'}]},
         {'link': [{'domain': 'random.com',
                    'path': 'css/jquery.mCustomScrollbar.min.css'}]},
         {'link': [{'domain': 'netdna.bootstrapcdn.com',
                    'path': '/font-awesome/4.0.3/css/font-awesome.css'}]}]]

# open file for writing
with open("domain.txt", "w") as outfile:
    # create a set to check for duplicates
    seen = set()
    for top in data:
        for e in top:

            # get domain data either from script or link
            se = e.get("script") or e.get("link")

            # fetch the domain name
            domain = se[0]["domain"]

            # write if not previously seen
            if domain not in seen:
                seen.add(domain)
                outfile.write(f"{domain}\n")

輸出

random.com
cdnjs.cloudflare.com
netdna.bootstrapcdn.com

Answer 2

看起來似乎不需要大量的內部列表，但如果您真的需要它們，那么這應該處理所有可能發生的情況：

taglist = [[{'script': [{'domain': 'random.com', 'path': 'js/custom.js'}]},
 {'script': [{'domain': 'cdnjs.cloudflare.com',
              'path': '/ajax/libs/fancybox/2.1.5/jquery.fancybox.min.js'}]},
 {'link': [{'domain': 'random.com', 'path': 'css/bootstrap.min.css'}]},
 {'link': [{'domain': 'random.com', 'path': 'css/style.css'}]},
 {'link': [{'domain': 'random.com', 'path': 'css/responsive.css'}]},
 {'link': [{'domain': 'random.com',
            'path': 'css/jquery.mCustomScrollbar.min.css'}]},
 {'link': [{'domain': 'netdna.bootstrapcdn.com',
            'path': '/font-awesome/4.0.3/css/font-awesome.css'}]}]]
D = set()
with open('domain.txt', 'w') as dfile:
    for tag in taglist:
        for subtag in tag:
            if (d := subtag.get('script', None)) is None:
                if (d := subtag.get('link', None)) is None:
                    continue
            for e in d:
                if (domain := e.get('domain', None)):
                    D.add(domain)
    for domain in D:
        print(domain, file=dfile)

[注意：為此您需要 Python 3.8+]

如何從字典列表中過濾並寫入文件？

問題描述

2 個解決方案

解決方案1
2 2021-10-19 08:10:31

解決方案2
2 已采納 2021-10-19 08:25:50

如何從字典列表中過濾並寫入文件？

問題描述

2 個解決方案

解決方案1 2 2021-10-19 08:10:31

解決方案2 2 已采納 2021-10-19 08:25:50

解決方案1
2 2021-10-19 08:10:31

解決方案2
2 已采納 2021-10-19 08:25:50