Python Selenium無法通過xpath查找表元素

Question

這是網頁上表格的外觀（僅一列）：

這是我要抓取的表格的HTML：

如果重要的話，該表將嵌套在另一個表中。

這是我的代碼：

    def filter_changed_records():
        # Scrape webpage for addresses from table of changed properties
        row_number = 0
        results_frame = locate_element(
            '//*[@id="oGridFrame"]'
        )
        driver.switch_to.frame(results_frame)
        while True:
            try:
                address = locate_element("id('row" + str(row_number) +
                                         "FC')/x:td")
                print(address)
                changed_addresses.append(address)
                row_number += 1
            except:
                print("No more addresses to add.")
                break

如您所見，有一個<tr>標記，其id為row0FC 。 該表是動態生成的，每個新的<tr>都獲得一個ID，其ID的數字遞增： row0FC, row1FC, row2FC等。這就是我計划遍歷所有條目並將其添加到列表中的計划。

我的locate_element函數如下：

    def locate_element(path):
        element = WebDriverWait(driver, 50).until(
            EC.presence_of_element_located((By.XPATH, path)))
        return element

由於找不到元素，它總是在50秒后超時。 不確定如何進行。 有沒有更好的定位元素的方法？

安德森的解決方案

address = locate_element("//tr[@id='row%sFC']/td" % row_number).text

Answer 1

您的XPath似乎不正確。

請嘗試以下方法：

address = locate_element("//tr[@id='row%sFC']/td" % row_number)

還要注意， address是WebElement 。 如果要獲取其文本內容，則應使用

address = locate_element("//tr[@id='row%sFC']/td" % row_number).text

Answer 2

用硒分析html很慢。 我會為此使用BeautifulSoup。

假設您已將頁面加載到驅動程序中，則該過程類似於：

from bs4 import BeautifulSoup
....

soup = BeautifulSoup(driver.page_source, "html.parser")
td_list = soup.findAll('td')
for td in td_list:
    try:
        addr = td['title']
        print(addr)
    except:
        pass

Python Selenium無法通過xpath查找表元素

問題描述

2 個解決方案

解決方案1
0 已采納 2017-07-07 17:12:22

解決方案2
-1 2017-07-07 17:21:00

Python Selenium無法通過xpath查找表元素

問題描述

2 個解決方案

解決方案1 0 已采納 2017-07-07 17:12:22

解決方案2 -1 2017-07-07 17:21:00

解決方案1
0 已采納 2017-07-07 17:12:22

解決方案2
-1 2017-07-07 17:21:00