繁体   English   中英

如何使用带有Java的Selenium Webdriver从包围在多个span标签中的span元素中获取实际文本

[英]How to get the actual text from a span element enclosed within multiple span tags, using Selenium Webdriver with Java

嗨,我是Selenium Webdriver的新手。 请帮助我解决此问题。

HTML结构如下:

<div> "other attibutes"
    <span> "other attibutes"
        <span>  "other attibutes"
            <span> "other attibutes" Text </span>     
        </span>
    </span>
</div>

现在,我正在编写这样的Java代码:

public getCustomText() {
    List <WebElement> objSpanList = driver.findElement(By.id("dijit_layout_ContentPane_1")).findElements(By.tagName("span"));
    for (WebElement e : objSpanList) {
        System.out.println("The element text is : "+e.getText());
    }
}

当我调用此函数时,它的输出如下:

 Text 

 Text

 Text

输出中没有编译或运行时错误。

实际上,仅对于最后一个span元素,它具有文本,但是对于上span标记,它仅具有不同的属性,而没有元素文本。 所有span元素都具有last span元素的文本。 因此,我对硒Web驱动程序的行为感到困惑。

我不确定我是否获得正确的输出。 或这是上述的生成树的Selenium Web驱动程序的默认属性。

因此,请向我解释一下这里到底发生了什么,或者我最终会遇到一些错误。

您有3个<span>元素,一个在另一个元素之内,因此即使您自己承认,您的输出也是准确的:“所有span元素都具有最后一个span元素的文本”。

你可以改变:

List <WebElement> objSpanList = driver.findElement(By.id("dijit_layout_ContentPane_1")).findElements(By.tagName("span"));

至:

WebElement innerSpan = driver.findElement(By.xpath(\\div\span\span\span"));

您应该将Jsoup-一个JAVA HTML解析器库用于这些操作。 您的代码可以正常工作。 根据文档,

 getText() 

返回此元素(包括子元素)的可见(即未被CSS隐藏)的内部文本,不带任何前导或尾随空格

因此,它将返回子元素的内部文本。 即内部跨度元素的文本。 为了仅查找具有文本内容的内部span元素,您可以By类子类化并根据需要覆盖受保护的方法,尽管期望所有子类都依赖于此类静态方法提供的基本查找机制。

    List<WebElement> lst=driver.findElements(By.tagName("span"));
    for(int i=0;i<lst.size();i++)
    {System.out.println(lst.get(i).getText());}

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM