使用Python提取HTML

Question

解决的问题是无法单击并转到HTML页面的下一页。 正在访问一个HTML页面，该页面在搜索查询后显示结果。 在页面的底部，有一行数字可供您选择，即“ 1 2 3 4 next”-单击“ 2”会在第二页上显示结果。 如果您使用的是不同的页码，即2或3，则底部的行看起来像：“上一页1 2 3 4下一页”。 我正在使用Python和Webdriver单击以转到下一页以滚动查看结果。 第一次按下它，将带我进入下一页。 单击第二秒钟，它将带我到上一页。 意味着我停留在前两页上，看不到3和4的结果。我注意到发生这种情况的原因是因为li class =“ arrow”标记在HTML代码中出现了两次。 当进行第二次调用时，出现的第一个标签是带有“ arrow”类的标签。 我该如何点击呢？

HTML注意：-“ li”标记定义一个列表项

HTML代码：

单击下一步之前：

<div class="list">
<ul class="line">
<li class="current page"><a href>1</a></li>
<li><a href="/search_text=&&page=1">2</a></li>
<li><a href="/search_text=&&page=2">3</a></li>
<li><a href="/search_text=&&page=3">4</a></li>
<li class="arrow"><a href="/search_text=&&page=1">next</a></li>
</ul>
</div>

单击“下一步” HTML代码后，如下所示：

<div class="list">
<ul class="line">
<li class="arrow"><a href="/search_text=&">previous</a></li>
<li><a href="/search_text=&">1</a></li>
<li class="current page"><a href>2</a></li>
<li><a href="/search_text=&&page=2">3</a></li>
<li><a href="/search_text=&&page=3">4</a></li>
<li class="arrow"><a href="/search_text=&&page=2">next</a></li>
</ul>
</div>

Python代码：

chromedriver = "C:\temp\chromedriver.exe"
os.environ["webdriver.chrome.driver"] = chromedriver
driver = webdriver.Chrome(executable_path=r"C:\temp\chromedriver.exe")
driver.implicitly_wait(3)
driver.get(urlLink)


driver.find_element_by_css_selector("li.arrow").click() #Takes me to the next page
driver.find_element_by_css_selector("li.arrow").click() #Takes me to the previous page

..

Answer 1

您可以使用方法驱动程序。 find_element_by_link_text （'next'）查找元素，然后调用.click（）

Answer 2

或者，您可以将ID添加到下一个按钮并调用：

driver.find_element_by_id('whatever_id_you_use').click()

或通过添加一个类来区分下一个箭头和上一个箭头，以区分两者并调用：

driver.find_element_by_class_name('next_arrow').click()

使用Python提取HTML

问题描述

2 个解决方案

解决方案1
0 2016-06-06 21:51:36

解决方案2
0 2016-06-06 22:02:31

使用Python提取HTML

问题描述

2 个解决方案

解决方案1 0 2016-06-06 21:51:36

解决方案2 0 2016-06-06 22:02:31

解决方案1
0 2016-06-06 21:51:36

解决方案2
0 2016-06-06 22:02:31