Python：查找最频繁的字节？

Question

我正在寻找一种（最好是简单的）方法来查找和排序python流元素中最常见的字节。

例如

>>> freq_bytes(b'hello world')
b'lohe wrd'

甚至

>>> freq_bytes(b'hello world')
[108,111,104,101,32,119,114,100]

我目前有一个函数，该函数以list[97] == occurrences of "a"形式返回列表。 我需要对它进行排序。

我认为我基本上需要翻转列表，因此list[a] = b --> list[b] = a同时删除重复项。

Answer 1

在collections模块中尝试Counter类。

from collections import Counter

string = "hello world"
print ''.join(char[0] for char in Counter(string).most_common())

请注意，您需要Python 2.7或更高版本。

编辑：忘记了most_common（）方法返回值/计数元组的列表，并使用列表推导来获取值。

Answer 2

def frequent_bytes(aStr):
    d = {}
    for char in aStr:
        d[char] = d.setdefault(char, 0) + 1

    myList = []
    for char, frequency in d.items():
        myList.append((frequency, char))
    myList.sort(reverse=True)

    return ''.join(myList)

>>> frequent_bytes('hello world')
'lowrhed '

我只是尝试了一些显而易见的事情。 不过，@ kindall的答案很糟糕。 :)

Python：查找最频繁的字节？

问题描述

2 个解决方案

解决方案1
6 已采纳 2010-09-09 01:51:05

解决方案2
3 2010-09-09 01:52:45

Python：查找最频繁的字节？

问题描述

2 个解决方案

解决方案1 6 已采纳 2010-09-09 01:51:05

解决方案2 3 2010-09-09 01:52:45

解决方案1
6 已采纳 2010-09-09 01:51:05

解决方案2
3 2010-09-09 01:52:45