繁体   English   中英

如何使用 Selenium Python 在#shadow-root(打开)中提取信息?

[英]How to extract info within a #shadow-root (open) using Selenium Python?

我得到了与在线商店https://www.tiendasjumbo.co/buscar?q=mani相关的下一个 url 并且我无法提取产品 ZD304BA20E96D874341588EEABAC8 另一个字段

from selenium import webdriver
import time
from random import randint

driver = webdriver.Firefox(executable_path= "C:\Program Files (x86)\geckodriver.exe")
driver.implicitly_wait(10)
time.sleep(4)

url =  "https://www.tiendasjumbo.co/buscar?q=mani"
driver.maximize_window()
driver.get(url)
driver.find_element_by_xpath('//h1[@class="impulse-title"]')

我做错了什么,我也尝试切换 iframe 但没有办法实现我的目标? 欢迎任何帮助。在此处输入图像描述

https://www.tiendasjumbo.co/buscar?q=mani网站中的产品位于#shadow-root (open)中。

脉冲搜索


解决方案

要提取产品 label 您必须使用shadowRoot.querySelector()并且可以使用以下定位器策略

  • 代码块:

     driver.get('https://www.tiendasjumbo.co/buscar?q=mani') item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')") print(item.text)
  • 控制台 Output:

     La especial mezcla de nueces, maní, almendras y marañones x 450 g

参考

您可以在以下位置找到一些相关的讨论:

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM