如何使用带有Java的Selenium Webdriver从包围在多个span标签中的span元素中获取实际文本

Question

嗨，我是Selenium Webdriver的新手。 请帮助我解决此问题。

HTML结构如下：

<div> "other attibutes"
    <span> "other attibutes"
        <span>  "other attibutes"
            <span> "other attibutes" Text </span>     
        </span>
    </span>
</div>

现在，我正在编写这样的Java代码：

public getCustomText() {
    List <WebElement> objSpanList = driver.findElement(By.id("dijit_layout_ContentPane_1")).findElements(By.tagName("span"));
    for (WebElement e : objSpanList) {
        System.out.println("The element text is : "+e.getText());
    }
}

当我调用此函数时，它的输出如下：

 Text 

 Text

 Text

输出中没有编译或运行时错误。

实际上，仅对于最后一个span元素，它具有文本，但是对于上span标记，它仅具有不同的属性，而没有元素文本。 所有span元素都具有last span元素的文本。 因此，我对硒Web驱动程序的行为感到困惑。

我不确定我是否获得正确的输出。 或这是上述的生成树的Selenium Web驱动程序的默认属性。

因此，请向我解释一下这里到底发生了什么，或者我最终会遇到一些错误。

Answer 1

您有3个<span>元素，一个在另一个元素之内，因此即使您自己承认，您的输出也是准确的：“所有span元素都具有最后一个span元素的文本”。

你可以改变：

List <WebElement> objSpanList = driver.findElement(By.id("dijit_layout_ContentPane_1")).findElements(By.tagName("span"));

至：

WebElement innerSpan = driver.findElement(By.xpath(\\div\span\span\span"));

Answer 2

您应该将Jsoup-一个JAVA HTML解析器库用于这些操作。 您的代码可以正常工作。 根据文档，

 getText()

返回此元素（包括子元素）的可见（即未被CSS隐藏）的内部文本，不带任何前导或尾随空格

因此，它将返回子元素的内部文本。 即内部跨度元素的文本。 为了仅查找具有文本内容的内部span元素，您可以By类子类化并根据需要覆盖受保护的方法，尽管期望所有子类都依赖于此类静态方法提供的基本查找机制。

Answer 3

    List<WebElement> lst=driver.findElements(By.tagName("span"));
    for(int i=0;i<lst.size();i++)
    {System.out.println(lst.get(i).getText());}

如何使用带有Java的Selenium Webdriver从包围在多个span标签中的span元素中获取实际文本

问题描述

3 个解决方案

解决方案1
1 2014-01-17 09:40:23

解决方案2
0 已采纳 2014-01-17 09:36:35

解决方案3
0 2014-02-03 08:02:20

如何使用带有Java的Selenium Webdriver从包围在多个span标签中的span元素中获取实际文本

问题描述

3 个解决方案

解决方案1 1 2014-01-17 09:40:23

解决方案2 0 已采纳 2014-01-17 09:36:35

解决方案3 0 2014-02-03 08:02:20

解决方案1
1 2014-01-17 09:40:23

解决方案2
0 已采纳 2014-01-17 09:36:35

解决方案3
0 2014-02-03 08:02:20