簡體   English   中英

Gensim用短段文本摘要

[英]Text Summarization with Gensim with short paragraph

我是NLP的新手。 我試圖在python中使用Gensim提取段落的摘要。

我正面臨一個短段問題,它給了我一個警告,如下所示,並沒有給我一個短段的摘要。

這是我在Python中的代碼:

 import logging
 logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
 from gensim.summarization import summarize

text = "short paragraph"
print ('Summary:')
print (summarize(text))

它給了我如下警告:

2018-02-01 17:31:47,247 : WARNING : Input text is expected to have at least 10 sentences.
2018-02-01 17:31:47,253 : INFO : adding document #0 to Dictionary(0 unique tokens: [])
2018-02-01 17:31:47,258 : INFO : built Dictionary(52 unique tokens: ['clearli', 'adult', 'chang', 'member', 'visit']...) from 4 documents (total 70 corpus positions)
2018-02-01 17:31:47,262 : WARNING : Input corpus is expected to have at least 10 documents.
2018-02-01 17:31:47,285 : WARNING : Couldn't get relevant sentences.

輸出為(僅打印摘要標簽而不是短段的實際摘要):

Summary:

我錯過了什么嗎? 是否還有其他庫。

你真的使用"some paragraph"作為輸入嗎? 如果是這樣,我發現你的腳本沒有拋出ZeroDivisionErrorZeroDivisionError gensim總結基於TextRank 根據文檔

“輸入應該是一個字符串,並且必須長於INPUT_MIN_LENGTH個句子才能使摘要有意義。文本將使用summarization.texcleaner模塊中的split_sentences方法拆分成句子。請注意,換行符會對句子進行划分。”

考慮到這一點,看看這個

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM