列表中最常见的单词，其中包含列表

Question

我有一个包含其他列表的列表数据集，我想找到前 1000 个单词

我试过这个，但它不起作用：

从 collections 导入计数器 counts_top1000 = [字对字，计数器中的字数（主列表）.most_common（1000）]

请注意，我的数据集是“主列表”。

如果您有更多想法，我将不胜感激。

Answer 1

鉴于数据看起来像mainlist = [[word11, word12, ...], [word21, word22, ...], ...] ，您可以执行以下操作

from collections import Counter
from itertools import chain
Counter(chain(*mainlist)).most_common(100)