[英]most frequent words in list which contains lists
我有一个包含其他列表的列表数据集,我想找到前 1000 个单词
我试过这个,但它不起作用:
从 collections 导入计数器 counts_top1000 = [字对字,计数器中的字数(主列表).most_common(1000)]
请注意,我的数据集是“主列表”。
如果您有更多想法,我将不胜感激。
鉴于数据看起来像mainlist = [[word11, word12, ...], [word21, word22, ...], ...]
,您可以执行以下操作
from collections import Counter
from itertools import chain
Counter(chain(*mainlist)).most_common(100)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.