如何在python中使用selenium定位或提取html文件中的文本？

Question

如何在 Python 中使用 Selenium 定位或提取 HTML 文件中的文本。 我试图获得的文本不是一个元素。

<div class="datagrid row"> ==$0
 <h2 class="bottom-border block">Accepted Shipment</h2>
 <table>
  <tbody>
   <tr>
    <td>
     <input type="hidden" id="looseAcceptedPieces" value="56"> == $0
      " 56 pcs."

    <!--Modified by A-7558 for ICRD-244765 starts--> == $0
    <input type="hidden" id="acceptedWt" value> == $0
     "952 kg"

我如何在<input>下找到或获取该文本，即56 个。 和952 公斤也许，他们不是元素。

Answer 1

您可以使用get_attribute("value")方法获取值

piece = driver.find_element_by_id('looseAcceptedPieces')
val = piece.get_attribute("value")

和

weight = driver.find_element_by_id('acceptedWt')
val2 = weight.get_attribute("value")

Answer 2

提取文本56 个。 和952 kg，因为这些是您需要使用execute_script()方法为visibility_of_element_located()引入WebDriverWait 的文本节点，您可以使用以下基于xpath的定位器策略之一：

提取56 个。 ：

 print(driver.execute_script('return arguments[0].childNodes[2].textContent;', WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, "//h2[text()='Accepted Shipment']//following::table[1]/tbody/tr/td")))).strip())

提取952 公斤：

 print(driver.execute_script('return arguments[0].lastChild.textContent;', WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, "//h2[text()='Accepted Shipment']//following::table[1]/tbody/tr/td")))).strip())

注意：您必须添加以下导入：

 from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC

参考

您可以在以下位置找到相关讨论：

如何在python中使用selenium定位或提取html文件中的文本？

问题描述

2 个解决方案

解决方案1
1 2020-02-28 06:31:59

解决方案2
0 2020-02-28 07:54:22

参考

如何在python中使用selenium定位或提取html文件中的文本？

问题描述

2 个解决方案

解决方案1 1 2020-02-28 06:31:59

解决方案2 0 2020-02-28 07:54:22

参考

解决方案1
1 2020-02-28 06:31:59

解决方案2
0 2020-02-28 07:54:22