簡體 English 中英

如何阻止python news3k返回空值？

[英]How to stop python newspaper3k from returning null values?

原文 2019-02-12 17:16:31 8 1 python/ mysql/ sql/ null

我最近一直在使用python報紙庫，並且正在嘗試創建一個系統來搜索BBC新聞網站上的所有文章，並將每個標題插入WAMP服務器中PC上的MySQL數據庫中。 我的問題是，以下代碼同時返回了實際的文章標題和空值，這顯然是我在數據庫中不想要的。 有什么辦法可以阻止這種情況的發生？

謝謝：）

import newspaper
import mysql.connector

mydb = mysql.connector.connect(
  host="localhost",
  user="root",
  passwd="",
  database="headlines"
)

mycursor = mydb.cursor()

sql = "insert into headlines (headline) values (%s)"

search = newspaper.build('https://www.bbc.co.uk/news')

for article in search.articles:

    mycursor.execute(sql, (article.title,))
    mydb.commit()

1 個解決方案

我假設您數據庫中的空條目顯示為“ None來自Python的條目已上傳到您的MySQL服務器。 在這種情況下，您可以簡單地檢查文章是否為None ，然后跳過將其上傳到數據庫的操作。

for article in search.articles:
    if article is None:
        continue
    mycursor.execute(sql, (article.title,))
    mydb.commit()

Newspaper3k 的缺點：如何只刮文章 HTML？ Python

[英]Shortcomings of Newspaper3k: How to Scrape ONLY Article HTML? Python

如何在報紙3k中訪問緩存的文章

[英]How to access cached articles in newspaper3k

Web 用 Python 和報紙 3k 庫抓取不返回數據

[英]Web Scraping with Python and newspaper3k lib does not return data

使用 news3k 從新聞來源獲取更多文章 URL？

[英]Get more article URLs from a news source with newspaper3k?

如何在不下載文章的情況下使用 Newspaper3k 庫？

[英]How to use Newspaper3k library without downloading articles?

無法使用報紙3k下載文章

[英]Cannot download article using newspaper3k

Newspaper3k 返回 None 摘要

[英]Newspaper3k returns None summary

ModuleNotFoundError：沒有名為“ newspaper3k”的模塊

[英]ModuleNotFoundError: No module named 'newspaper3k'

為什么python模塊報紙3k只為騰訊，新浪和wallettreetcn返回0篇文章？

[英]Why the python module newspaper3k only return 0 articles for tencent, sina and wallstreetcn?

Newspaper3k從archive.org waybackmachine頁面返回0篇文章，而實時頁面按預期工作

[英]Newspaper3k returns 0 articles from archive.org waybackmachine pages whereas the live page works as expected

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Newspaper3k 的缺點：如何只刮文章 HTML？ Python 如何在報紙3k中訪問緩存的文章 Web 用 Python 和報紙 3k 庫抓取不返回數據使用 news3k 從新聞來源獲取更多文章 URL？如何在不下載文章的情況下使用 Newspaper3k 庫？無法使用報紙3k下載文章 Newspaper3k 返回 None 摘要 ModuleNotFoundError：沒有名為“ newspaper3k”的模塊為什么python模塊報紙3k只為騰訊，新浪和wallettreetcn返回0篇文章？ Newspaper3k從archive.org waybackmachine頁面返回0篇文章，而實時頁面按預期工作

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM