簡體   English   中英

Python:來自 WordCloud 的字數統計

[英]Python: word count from WordCloud

我在文本正文中使用 WordCloud,我想查看雲中每個單詞的實際計數。 我可以使用 .words_ 查看加權頻率,但我想知道是否有一種簡單的方法可以查看實際計數?

# Generate a word cloud image
wordcloud = WordCloud(background_color="white").generate(text)
wordfreq = wordcloud.words_

編輯:我希望能夠從 WordCloud 中查看字數(而不是自己從文本中查找字數)的原因是因為 WordCloud 在其分析中包含短語(搭配)以及單個單詞。 因此,例如,將出現“水資源”的計數,以及“水資源”中未出現的“水”一詞的計數。 WordCloud 似乎還將以復數形式出現的單詞的實例添加到單詞的單數計數中(例如,在“水資源”的計數中計算“水資源”)。

只需使用WordCloud().process_text(text)

>>> WordCloud().process_text('penn penn penn penn penn state state state state uni uni uni college college university states vice president vice president vice president vice president vice president vice president vice president')
{'penn': 5, 'state': 5, 'uni': 3, 'college': 2, 'university': 1, 'vice president': 7}

請注意,它將“州”合並到“州”計數中,並將“副總統”視為一個二元組。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM