Selenium Python - 从 Class 中提取文本

Question

我正在尝试从下图中的第二个“深” class 中提取文本。 在这种情况下，它将是“Sauvage”这个词

我做了以下事情：

search_perfumes = driver.find_elements(By.XPATH,'//span[@class="deep"][1]')
for perfumes in search_perfumes:
    list_perfumes.append(perfumes.text)

列表的长度正确显示了 23 个元素（这是正确的，因为该页面有 23 种香水），但列表有 23 个空元素。 我似乎无法提取“深” class 之后的文本。

关于我可能会出错的地方的任何想法？

Answer 1

您正在尝试从匹配//span[@class="deep"] XPath 的第二个web 元素中提取文本。
您可能错过了等待，试图在元素完全加载之前提取文本。 我不确定，因为您不共享所有代码。
请试试这个：

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

wait = WebDriverWait(driver, 20)

wait.until(EC.visibility_of_element_located((By.XPATH, '//span[@class="deep"]')))
search_perfumes = driver.find_elements(By.XPATH,'//span[@class="deep"]')
for perfumes in search_perfumes:
    list_perfumes.append(perfumes.text)

Answer 2

基于您分享的Html ，您可以使用 XPath 索引：

(//span[@class='deep'])[2]

在代码中：

print(WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, "(//span[@class='deep'])[2]"))).text)

进口：

from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC

现在您必须确保[2]代表整个 HTML 中的Sauvage 。 您可以将索引从[2]增加到或减少到任何其他匹配的数字。

你会怎么做？ - 您需要确保我们在 HTMLDOM 中有一个唯一的匹配节点。 请参阅下面的详细说明：

如果我们在HTML DOM中有唯一条目，请检查dev tools （谷歌浏览器）。

检查步骤：

Press F12 in Chrome -> go 到element部分 -> 执行CTRL + F -> 然后粘贴xpath并查看，如果您想要的element使用1/1匹配节点突出显示。

此外，您可以使用此 xpath //span[@class='deep']获得 web 元素的列表

for ele in driver.find_elements(By.XPATH, "//span[@class='deep']"):
    print(ele.text)

更新：

您必须首先单击位于影子根目录中的Accept all cookie 按钮：

代码：

driver = webdriver.Chrome(driver_path)

driver.maximize_window()
wait = WebDriverWait(driver, 30)

driver.get("https://www.parfumdreams.pt/?m=5&search=sauvage")

try:
    time.sleep(2)
    cookie_btn = driver.execute_script('return document.querySelector("#usercentrics-root").shadowRoot.querySelector("#uc-center-container > div.sc-jJoQJp.dTzACB > div > div > div > button")')
    cookie_btn.click()
    print('Clicked')
except:
    print('Could not click')
    pass


print(WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, "(//span[@class='deep'])[2]"))).text)

或者如果你想要所有这些，而不是上面的打印命令，使用下面的代码：

for ele in driver.find_elements(By.XPATH, "//span[@class='deep']"):
    driver.execute_script("arguments[0].scrollIntoView(true);", ele)
    print(ele.text)

Output：

DIOR
Sauvage
DIOR
Sauvage
DIOR
Sauvage
DIOR
Sauvage
DIOR
Sauvage
DIOR
Sauvage
DIOR
Sauvage
DIOR
Eau Sauvage
DIOR
Eau Sauvage
DIOR
Eau Sauvage
DIOR
Eau Sauvage
DIOR
Eau Sauvage
DIOR
Eau Sauvage
DIOR
Eau Sauvage
DIOR
Eau Sauvage
DIOR
Eau Sauvage
DIOR
Eau Sauvage
DIOR
Eau Sauvage
Creed
Neroli Sauvage
DIOR
Eau Sauvage
DIOR
Lápis de lábios
DIOR
Lápis de lábios
Estée Lauder
Maquilhagem para lábios

Selenium Python - 从 Class 中提取文本

问题描述

2 个解决方案

解决方案1
0 2022-01-30 14:57:22

解决方案2
0 已采纳 2022-01-30 15:01:19

Selenium Python - 从 Class 中提取文本

问题描述

2 个解决方案

解决方案1 0 2022-01-30 14:57:22

解决方案2 0 已采纳 2022-01-30 15:01:19

解决方案1
0 2022-01-30 14:57:22

解决方案2
0 已采纳 2022-01-30 15:01:19