簡體 English 中英

如何解決新聞網站抓取問題？

[英]How to solve news website-scraping issue?

原文 2021-12-29 18:04:32 6 1 python/ web-scraping/ beautifulsoup/ python-requests

我想從網站上抓取犯罪新聞文章，但是湯 object 沒有返回所需的“div”標簽，誰能給我一些理由？

import requests
from bs4 import BeautifulSoup 

page = requests.get("https://www.nst.com.my/news/crime-courts?page=1") 
soup = BeautifulSoup(page.text, 'html.parser')
print(soup)

1 個解決方案

這個問題的答案太寬泛，無法在此涵蓋。 您需要先學習使用Selenium web 驅動程序，或者任何其他可以讓您獲取源代碼 HTML 的方法，然后您可以使用美麗的湯來解析它。

或者，您可以檢查頁面上的 JavaScript 以更好地了解內容的提供方式。

搜索“ 使用 Selenium 和 Python 抓取動態 web 站點”

網站抓取，機器人識別

[英]Website-scraping , robot-identification

Python Web 抓取 - 如何 24/7 全天候抓取新聞網站以獲取新文章？

[英]Python Web Scraping - How to scrape a News website 24/7 for new articles?

Web 抓取無法從 Daraz 網站上的評論中讀取數據。我該如何解決這個問題？

[英]Web scraping cannot able to read data from reviews on the Daraz website. How can I solve this issue?

Scraping Dawn新聞網站返回（引薦來源：無）

[英]Scraping Dawn news website returns (referer:None)

無限加載從新聞網站上抓取標題

[英]scraping headlines from news website with infinite loading

通過使用 selenium 單擊更多新聞按鈕來抓取新聞網站聚合器

[英]scraping news website aggregator by clicking on more news button using selenium

使用 Python 中的 BeautifulSoup 從新聞網站主頁上抓取標題

[英]Scraping Headlines From News Website Homepages Using BeautifulSoup in Python

從渲染的網站上抓取的問題

[英]Issue with scraping from rendered website

網頁抓取新聞文章

[英]Web Scraping News Articles

搜尋linkedin新聞提要

[英]Scraping linkedin news feed

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 網站抓取，機器人識別 Python Web 抓取 - 如何 24/7 全天候抓取新聞網站以獲取新文章？ Web 抓取無法從 Daraz 網站上的評論中讀取數據。我該如何解決這個問題？ Scraping Dawn新聞網站返回（引薦來源：無）無限加載從新聞網站上抓取標題通過使用 selenium 單擊更多新聞按鈕來抓取新聞網站聚合器使用 Python 中的 BeautifulSoup 從新聞網站主頁上抓取標題從渲染的網站上抓取的問題網頁抓取新聞文章搜尋linkedin新聞提要

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM