簡體   English   中英

如何使用 selenium 和 python 從動態生成的頁面中抓取內容?

[英]How do I scrape content from a dynamically generated page using selenium and python?

我嘗試了很多次,但都未能以可靠和完整的方式記錄我需要的數據。 我了解 python 和 selenium 用於自動執行簡單任務的極端基礎知識,但在這種情況下,內容是動態生成的,我無法找到正確的方法來訪問並隨后記錄我需要的所有數據。

我希望從中抓取內容的 URL 的結構類似於以下內容:

https://dutchie.com/embedded-menu/revolutionary-clinics-somerville/menu

特別是我正在嘗試使用類似的東西來獲取所有信息 -

browser.find_elements_by_xpath('//*[@id="products-container"]

這是正確的方法嗎? 如何訪問此元素的特定子元素(以及同一路徑的所有元素)

我讀過我可能需要beautifulsoup4,但我不確定解決這個問題的最佳方法。

最好的方法是使用 xpaths 嗎? 如果是這樣,有沒有辦法遍歷所有元素並記錄其中的所有數據,還是我必須指定我所追求的每個數據點?

任何能幫助我指明正確方向的幫助都會非常有幫助,因為我仍在學習並且在我的進步中遇到了障礙。

我的最終目標是列出所有產品名稱、價格和我認為基於手頭的具體練習相關的任何其他數據點。 如果我能找到訪問數據點的正確方法,我就可以存儲它們並根據需要比較/報告它們。

謝謝!

我想你正在尋找類似的東西

browser.find_elements_by_css_selector('[class*="product-information__Title"]')

這應該會找到以該字符串開頭的 class 的所有元素。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM