簡體   English   中英

使用 selenium 從沒有任何 HTML 標簽的網站中提取文本

[英]Extract Text from Website without any HTML tags with selenium

在此處輸入圖像描述

無法將突出顯示的文本單獨提取為帶有 selenium 的字符串,因為這兩個是沒有標簽的硬編碼文本,請讓我知道任何可能性。

您可以使用以下 xpath:

//strong[text()='Customer']/../following-sibling::div/descendant::div[starts-with(@class,'col-md-10')]

像這樣:

String gottenText = new WebDriverWait(driver, Duration.ofSeconds(20)).until(ExpectedConditions.visibilityOfElementLocated(By.xpath("//strong[text()='Customer']/../following-sibling::div/descendant::div[@class='col-md-10']"))).getAttribute("innerText");
System.out.println(gottenText);

應提供以下 output:

Email user@phptravels.com
Password demouser

更新:

您可以將它們存儲到 String 變量中,如下所示:

String gottenText = new WebDriverWait(driver, Duration.ofSeconds(20)).until(ExpectedConditions.visibilityOfElementLocated(By.xpath("//strong[text()='Customer']/../following-sibling::div/descendant::div[@class='col-md-10']"))).getAttribute("innerText");
String[] arr = gottenText.split(" ");
String[] userNames = arr[1].split("\\r?\\n");
String userName = userNames[0];
String password = arr[2];
    
System.out.println(userName + " " + password);

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM