簡體 English 中英

如何使用BeautifulSoup抓取用javascript生成的數據？

[英]How do I scrape data generated with javascript using BeautifulSoup?

原文 2018-01-23 01:54:07 4 1 javascript/ python/ json/ web-scraping/ beautifulsoup

我正在嘗試使用python和BeautifulSoup的網絡抓取功能從博客中遷移一些評論。 我要查找的內容不在HTML本身中，並且似乎是在script標簽（我找不到）中生成的。 我已經看到了一些有關此問題的答案，但是大多數答案都是特定於某個問題的，我似乎無法弄清楚如何將其應用於我的網站。 我只是想從這樣的頁面中抓取評論：

http://www.themasterpiececards.com/famous-paintings-reviewed/bid/92327/famous-paintings-duccio-s-maesta

我也嘗試過Selenium，但是我目前正在使用基於Cloud9的IDE，它似乎不支持Web驅動程序。

如果我搞砸了任何術語，我深表歉意，我是編程新手。 如果有人有任何提示，那將有所幫助。 謝謝！

1 個解決方案

您有很多方法可以刪除此類內容。 一種是找出如何在此網站上加載評論。 在Chrome開發人員工具中快速查找時，通過此 api調用會加載針對該頁面的注釋。

這可能不適合您，因為您可能不會為每個不同的頁面生成此URL。

另一種更可靠的方法是使用無GUI瀏覽器呈現此類js內容，為便於實現，我建議使用scrapy with splash .Splash是一個python框架，可為您的請求呈現大部分內容。

如何使用python抓取JavaScript生成的數據

[英]How to scrape data generated by javascript using python

如何抓取似乎使用 javascript 生成且無法直接打開的 aspx 網站

[英]How do I scrape an aspx website that seems to be generated using javascript and cannot be directly opened

如何使用由 Javascript 函數生成的 Ruby 抓取數據？

[英]How to scrape data using Ruby which is generated by a Javascript function?

我如何從網頁中抓取 HTML 代碼，因為它使用的是 beautifulsoup 而不丟失文本格式？

[英]How do I scrape the HTML code from a webpage as it is using beautifulsoup without losing text format?

如何從 JavaScript 網站抓取數據？

[英]How do I scrape data from JavaScript website?

我如何抓取數據<canvas>元素與 python 或 javascript？

[英]How do I scrape data in <canvas> element with python or javascript?

當有生成的標簽時，我如何 web 刮？

[英]How do I web scrape when there are generated tags?

如何在Python中抓取JS生成的登錄令牌？

[英]How do I scrape the login token generated by JS in Python?

如何使用javascript / jQuery指示javascript生成的ID？

[英]how do I indicate a javascript generated ID using javascript/jQuery?

我如何在這個網頁上抓取JS生成的數據？

[英]How would I scrape the JS-generated data on this webpage?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何使用python抓取JavaScript生成的數據如何抓取似乎使用 javascript 生成且無法直接打開的 aspx 網站如何使用由 Javascript 函數生成的 Ruby 抓取數據？我如何從網頁中抓取 HTML 代碼，因為它使用的是 beautifulsoup 而不丟失文本格式？如何從 JavaScript 網站抓取數據？我如何抓取數據<canvas>元素與 python 或 javascript？當有生成的標簽時，我如何 web 刮？如何在Python中抓取JS生成的登錄令牌？如何使用javascript / jQuery指示javascript生成的ID？我如何在這個網頁上抓取JS生成的數據？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM