字符串列表中的Python频繁出现列表

Question

我正在编写一个python函数，该函数使用字符串列表并生成最频繁出现的项目的列表。

例如：

>>> trending(["banana", "trouble", "StarWars", "StarWars", "banana", "chicken", "BANANA"])
["banana", "StarWars"]

但

>>> trending(["banana", "trouble", "StarWars", "Starwars", "banana", "chicken"])
["banana"]

到目前为止，我已经编写了一个仅产生经常出现的第一个单词而不是经常出现的单词列表的函数。 此外，我的列表还包含该一项经常性项目的索引。

def trending(slst):
    words = {}
    for word in slst:
        if word not in words:
            words[word] = 0
        words[word] += 1
    return words

如何修复此函数以产生最频繁出现的项目的列表（而不是最频繁出现的项目的第一个），以及如何删除索引？

Answer 1

如果不使用Counter ，则可以使用dict来创建自己的计数器并提取频繁项：

def trending(slst):
    count = {}
    items = []

    for item in set(slst):
        count[item] = slst.count(item)

    for k, v in count.items():
        if v == max(count.values()):
            items.append(k)

    return items

Answer 2

使用Counter ：

In [1]: from collections import Counter

In [2]: l = ["banana", "trouble", "StarWars", "StarWars", "banana", "chicken", "BANANA"]

In [3]: Counter(l)
Out[3]: Counter({'StarWars': 2, 'banana': 2, 'BANANA': 1, 'trouble': 1, 'chicken': 1})

使用Counter(l).most_common(n)您可以获得n最常见的项目。

更新

您的trending()函数基本上也是Counter所做的。 在计算单词出现次数之后，您可以使用max(words.values())获得最大出现次数。 这可以用于过滤单词列表：

def trending(slst):
    ...
    max_occ = max(words.values())
    return [word for word, occ in words.items() if occ == max_occ]

Answer 3

以下解决方案仅使用列表。 不使用dictionary ， set或其他Python集合：

def trending(words):
    lcounts = [(words.count(word), word) for word in words]
    lcounts.sort(reverse=True)
    ltrending = []

    for count, word in lcounts:
        if count == lcounts[0][0]:
            if word not in ltrending:
                ltrending.append(word)
        else:
            break

    return ltrending


ltests = [
    ["banana", "trouble", "StarWars", "StarWars", "banana", "chicken", "BANANA"],
    ["banana", "trouble", "StarWars", "Starwars", "banana", "chicken"]]

for test in ltests:
    print trending(test)

它给出以下输出：

['banana', 'StarWars']
['banana']

字符串列表中的Python频繁出现列表

问题描述

3 个解决方案

解决方案1
3 已采纳 2015-07-12 15:24:17

解决方案2
2 2015-07-12 15:15:47

更新

解决方案3
0 2015-07-13 08:00:16

字符串列表中的Python频繁出现列表

问题描述

3 个解决方案

解决方案1 3 已采纳 2015-07-12 15:24:17

解决方案2 2 2015-07-12 15:15:47

更新

解决方案3 0 2015-07-13 08:00:16

解决方案1
3 已采纳 2015-07-12 15:24:17

解决方案2
2 2015-07-12 15:15:47

解决方案3
0 2015-07-13 08:00:16