簡體   English   中英

Python Newspaper庫結果不一致嗎?

[英]Python Newspaper library results are inconsistent?

我正在使用安裝了報紙的Anaconda3。 看起來很簡單,但是結果不一致。

http://newspaper.readthedocs.io/en/latest/

import newspaper
cnn_paper = newspaper.build('http://www.cnn.com')
for article in cnn_paper.articles:
    print(article.url)
print(cnn_paper.size())

這個簡單的代碼有時返回所有結果,而其他時候則不返回任何結果。

是否有人使用此庫或了解更好的庫來抓取新聞網站? 我寧願不必自己編寫解析器,但是如果歸結為該解析器,我應該使用什么?

找到固定

https://github.com/codelucas/newspaper/issues/243

cnn_paper = newspaper.build('http://cnn.com', memoize_articles=False)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM