計算集合列表中的出現次數

Question

我有一個包含 2 個集合列表的變量，它看起來像這樣：

[[{'angular', 'java', 'sql', 'xml-schema'},
  {'db2', 'docker', 'git', 'hibernate', 'jenkins', 'maven', 'rest'}],
 [{'java'}, {'maven'}],
 [{'java'}, {'oracle'}],
 [{'c++', 'cobol', 'java', 'javascript'}, set()],
 [{'angular', 'java'}, set()],
 [{'java'}, set()]]

現在我想做的是計算每個項目的出現次數，我只是不知道該怎么做。 我應該展平整個列表還是有一些關於可以做到這一點的集合的功能？

謝謝！

Answer 1

您可以使用collections.Counter並向他提供您的數據的扁平版本

from collections import Counter

values: list[list[set[str]]] = [
    [{'angular', 'java', 'sql', 'xml-schema'}, {'db2', 'docker', 'git', 'hibernate', 'jenkins', 'maven', 'rest'}],
    [{'java'}, {'maven'}],
    [{'java'}, {'oracle'}],
    [{'c++', 'cobol', 'java', 'javascript'}, set()],
    [{'angular', 'java'}, set()],
    [{'java'}, set()]
]

language = 'java'

ocurrences = Counter([word for sublist in values for subset in sublist for word in subset])
print(ocurrences.most_common(3))  # [('java', 6), ('angular', 2), ('maven', 2)]
print(ocurrences[language])  # 6

如果你想分開 2 套，在語言/其他，這樣做

ocurrences_languages = Counter([word for sublist in values for word in sublist[0]])
print(ocurrences_languages.most_common(3))  # [('java', 6), ('angular', 2), ('sql', 1)]

ocurrences_other = Counter([word for sublist in values for word in sublist[1]])
print(ocurrences_other.most_common(3))  # [('maven', 2), ('docker', 1), ('rest', 1)]

Answer 2

如果你想要它沒有外部模塊，你可以試試我寫的這個函數，只要根對象是一個字符串（可變），它就可以處理任何格式的列表：

def count(list_, count_dict=dict()):
    for i in list_:
        if type(i) == str:
            if i in list(count_dict.keys()):
                count_dict[i] += 1
            else:
                count_dict[i] = 1
        else:
            count_dict.update(count(i, count_dict))
    return count_dict
         


li = [[{'angular', 'java', 'sql', 'xml-schema'},
  {'db2', 'docker', 'git', 'hibernate', 'jenkins', 'maven', 'rest'}],
 [{'java'}, {'maven'}],
 [{'java'}, {'oracle'}],
 [{'c++', 'cobol', 'java', 'javascript'}, set()],
 [{'angular', 'java'}, set()],
 [{'java'}, set()]]
 
print(count(li))

計算集合列表中的出現次數

問題描述

2 個解決方案

解決方案1
1 已采納 2020-11-11 11:48:23

解決方案2
1 2020-11-11 11:58:01

計算集合列表中的出現次數

問題描述

2 個解決方案

解決方案1 1 已采納 2020-11-11 11:48:23

解決方案2 1 2020-11-11 11:58:01

解決方案1
1 已采納 2020-11-11 11:48:23

解決方案2
1 2020-11-11 11:58:01