[英]Extracting a table data from Webpage using Selenium webdriver
从我看来,您似乎已经构建了一个自定义表。 从所附图像的HTML摘录中,结构类似于:
<div class="ag-body-container" ...>
<div class="row_1_class" ...>
<div class="column_1_class" ...>
<div class="column_2_class" ...>
<div class="column_3_class" ...>
<div class="column_4_class" ...>
... etc
<div class="row_2_class" ...>
<div class="column_1_class" ...>
<div class="column_2_class" ...>
<div class="column_3_class" ...>
<div class="column_4_class" ...>
... etc
但是您的xPath假设您具有表行(并且我猜想以后可能是表单元格):
By.xpath("//div[@class='ag-row ag-row-even ag-row-level-0']//tr")
导致您的数组为空(很有趣,您没有得到NoSuchElement
异常,因此您的html树中可能有一些tr
标记)。
现在,我不确定您要从该表中提取什么数据,但是您最好的办法是根据class
属性获取所有行,并再次为每一行获取所有基于列的数据, class
属性(或者甚至可以使用col
属性)。
编辑:要获取所有元素,您可以占用所有行,然后为每一行获取所有列数据:
//Get all the rows from the table
List<WebElement> rows = driver.findElements(By.xpath("//div[contains(@class, 'ag-row')));
//Initialize a new array list to store the text
List<String> tableData = new ArrayList<String>();
//For each row, get the column data and store into the tableData object
for (int i=0; i < rows.size(); i++) {
//Since you also have some span tags inside (and maybe something else)
//we first get the div columns
WebElement tableCell = rows.get(i).findElements(By.xpath("//div[contains(@class, 'ag-cell')]"));
tableData.add(tableCell.get(0).getText());
}
您还可以将数据存储到双向数组(或任何此类数组)中,然后根据行号和列号的位置访问数据。
我不确定,但是您的webElements数组可能为空,这就是为什么您使Index超出范围异常的原因。
如果您尝试从整个WW_SALES行中获取价值,我想find_elements应该指定父div-class =“ ag-row ag-row-even ag-row-level-0”
这只是基于描述和图像的我的假设。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.