繁体   English   中英

使用 Selenium 抓取 Java 重度网站 - 不返回

[英]Using Selenium to Scrape Java-Heavy Website - Returning None

新编码器在这里。 一段时间以来,我一直试图在一个非常基于 Java 的网站上使用 Selenium抓取一段文本。 不知道我在这一点上做错了什么。

from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://explorer.helium.com/accounts/13pm9juR7WPjAf7EVWgq5EQAaRTppu2EE7ReuEL9jpkHQMJCjn9")

earnings = driver.find_elements_by_class_name('text-base text-gray-600 mb-1 tracking-tight w-full break-all')

print(earnings)

driver.quit()

尝试刮取的元素的图像:

在此处输入图片说明

我正在尝试从这个容器中提取美元金额,以便我最终可以在我正在构建的每日报告中使用它。

我尝试过的一切都导致它没有返回。 即使我尝试从该元素中获取文本。

这是网站链接: https : //explorer.helium.com/accounts/13pm9juR7WPjAf7EVWgq5EQAaRTppu2EE7ReuEL9jpkHQMJCjn9

您应该等到 javascript 加载、页面加载、元素加载。

_ = driver.Manage().Timeouts().ImplicitWait;

您可以创建条件,直到元素出现。

 ExpectedConditions ......  define selenium conditions

 //This is how we specify the condition to wait on.
 wait.until(ExpectedConditions.alertIsPresent());

您可以使用 XPATH ! 美元 XPATH 是

 /html/body/div[1]/div/article/div[2]/div/div[2]/div/div[2]/div[1]/div[2]/div[2]

Firefox XPATH 查找器

https://addons.mozilla.org/en-US/firefox/addon/xpath_finder/

你可以使用这个 xpath

//*[@id="app"]/article/div[2]/div/div[2]/div/div[2]/div[3]/div[1]/div[1]/div[3]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM