如何使用 Selenium 和 Python 从 HTML 中提取文本

Question

我有这个 HTML：

我想得到这个文本“ rataoriginal ”。 （这段文字有变化，我需要这部分代码作为文字）

我试过了

xpath = "//span[@class='_5h6Y_ _3Whw5 selectable-text invisible-space copyable-text']"
auxa = driver.find_element_by_xpath(xpath).text
print(auxa)

但它的打印结果与 print("\n") 相同。 我暂时不想使用 beaultifulsoup。

这个 HTML 来自“https://web.whatsapp.com”

Answer 1

//*[contains(text(),"rataoriginal")] 请使用这个 xpath

Answer 2

WebElement是一个动态元素，因此要打印您必须为visibility_of_element_located()诱导WebDriverWait的值，并且您可以使用以下任一Locator Strategies ：

使用CSS_SELECTOR ：

 print(WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.CSS_SELECTOR, "span.selectable-text.invisible-space.copyable-text[dir='auto']"))).text)

使用XPATH ：

 print(WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, "//span[contains(@class, '') and contains(@class, 'invisible-space')][contains(@class, '') and @dir='auto']"))).text)

注意：您必须添加以下导入：

 from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC

参考

您可以在以下位置找到相关讨论：

如何使用 Selenium 检索 WebElement 的文本 - Python

如何使用 Selenium 和 Python 从 HTML 中提取文本

问题描述

2 个解决方案

解决方案1
0 2020-07-16 07:19:22

解决方案2
0 已采纳 2020-07-16 12:54:58

参考

如何使用 Selenium 和 Python 从 HTML 中提取文本

问题描述

2 个解决方案

解决方案1 0 2020-07-16 07:19:22

解决方案2 0 已采纳 2020-07-16 12:54:58

参考

解决方案1
0 2020-07-16 07:19:22

解决方案2
0 已采纳 2020-07-16 12:54:58