Python：从迭代器内的列表中删除元素？

Question

我试图从Python中的列表中删除元素。 大多数答案似乎表明使用列表迭代器是最好的，但我不认为这对我的问题是可能的（或者至少是优雅的）。

我想迭代test_data列表并删除满足以下两个条件的任何项：（1）具有属性total:sum （2）具有以（但不等于）任何元素开头的属性（ pagePath ）列表mystrings 。

这是我的字符串列表，以及我的测试数据：

    mystrings = [u'/calculate-state-pension', u'/check-uk-visa']
    test_data = [
        {
            "pagePath": "/check-uk-visa",
            "total:sum": 2.0
        },
        {
            "pagePath": "/check-uk-visa/y",
            "total:sum": 3.0
        },
        {
            "pagePath": "/check-uk-visa/n",
            "total:sum": 4.0
        },
        {
            "pagePath": "/bank-holidays",
            "total:sum": 2.0
        },
        {
            "pagePath": "/check-uk-visa",
            "searchUniques:sum": 2.0
        }
    ]

所以我想最终得到这个列表：

    results = [
        {
            "pagePath": "/check-uk-visa",
            "total:sum": 2.0
        },
        {
            "pagePath": "/bank-holidays",
            "total:sum": 2.0
        },
        {
            "pagePath": "/check-uk-visa",
            "searchUniques:sum": 2.0
        }
    ]

这是我的代码：

    results = test_data[:]
    for r in results_copy:
        for s in mystrings:
            if 'total:sum' in r and r['pagePath'].startswith(s) \
                 and r['pagePath'] != s:
                results.remove(r)
    return results

但这似乎不起作用。 它使用/check-uk-visa/y删除元素，但不使用/check-uk-visa/n删除元素。

我究竟做错了什么？ 我认为它与删除和迭代器有关 - 看起来它正在跳过元素。

Answer 1

您想要"pagePath"值以字符串列表中的字符串"pagePath"但不等于字符串的any组合。

for dic in test_data[:]:
    s = dic.get("pagePath","")
    if "total:sum" in dic and any(s.startswith(y) and s != y  for y in mystrings):
        test_data.remove(dic)

[{'total:sum': 2.0, 'pagePath': '/check-uk-visa'}, {'total:sum': 2.0, 'pagePath': '/bank-holidays'}, {'searchUniques:sum': 2.0, 'pagePath': '/check-uk-visa'}]

一个警告是，如果你的mystrings列表中有类似的字符串，其中一个可能以相同的字母开头但不相等但可能等于另一个，所以在这种情况下我们可以使用一个集合进行0（1）查找并使用。

mystrings = {u'/calculate-state-pension', u'/check-uk-visa'}

for dic in test_data[:]:
    s = dic.get("pagePath","")
    if "total:sum" in dic and any(s.startswith(y) for y in mystrings)and s not in mystrings:
        test_data.remove(dic)
print(test_data)

Answer 2

过滤此类内容的最简单方法通常是使用filter功能。

results_copy = filter(lambda r: ('total:sum' in r
                                 and any([r['pagePath'].startswith(s) 
                                                             for s in mystrings])
                                 and r['pagePath'] not in mystrings), 
                      results)

或者，您可以使用列表推导。 除了过滤之外，当您想要进行一些处理时，有时会更容易阅读：

results_copy = [r for r in results if ('total:sum' in r
                                       and any([r['pagePath'].startswith(s) 
                                                             for s in mystrings])
                                       and r['pagePath'] not in mystrings)]

Python：从迭代器内的列表中删除元素？

问题描述

2 个解决方案

解决方案1
2 已采纳 2015-02-01 21:51:35

解决方案2
1 2015-02-01 21:58:46

Python：从迭代器内的列表中删除元素？

问题描述

2 个解决方案

解决方案1 2 已采纳 2015-02-01 21:51:35

解决方案2 1 2015-02-01 21:58:46

解决方案1
2 已采纳 2015-02-01 21:51:35

解决方案2
1 2015-02-01 21:58:46