使用Selenium Webdriver（Python）循环链接

Question

下午全部。 目前正在尝试使用Selenium webdriver遍历页面上的链接列表。 具体来说，它点击一个链接，从所述页面抓取一行文本以写入文件，返回，然后单击列表中的下一个链接。 以下是我所拥有的：

    def test_text_saver(self):
    driver = self.driver
    textsave = open("textsave.txt","w")
    list_of_links = driver.find_elements_by_xpath("//*[@id=\"learn-sub\"]/div[4]/div/div/div/div[1]/div[2]/div/div/ul/li")
    """Initializing Link Count:"""
    link_count = len(list_of_links)
    while x <= link_count:
        print x
        driver.find_element_by_xpath("//*[@id=\"learn-sub\"]/div[4]/div/div/div/div[1]/div[2]/div/div/ul/li["+str(x)+"]/a").click()
        text = driver.find_element_by_xpath("//*[@id=\"learn-sub\"]/div[4]/div/div/div/div[1]/div[1]/div[1]/h1").text
        textsave.write(text+"\n\n")
        driver.implicitly_wait(5000)
        driver.back()
        x += 1
    textsave.close()

运行时，它会进入初始页面，然后...返回主页面，而不是它应该的子页面。 打印x，我可以看到它增加了三倍而不是一次。 之后它也崩溃了。 我已经检查了所有的xpath等等，并且还确认它获得了列表中链接数量的正确计数。

任何输入都非常受欢迎 - 这实际上只是为了展示我的python /自动化，因为我刚刚进入两者。 提前致谢！！

Answer 1

我不确定这是否能解决问题，但一般情况下最好使用WebDriverWait而不是implicitly_wait因为WebDriveWait.until将继续调用提供的函数（例如driver.find_element_by_xpath ），直到返回的值不是False -ish或者达到超时（例如5000秒） - 此时它会引发selenium.common.execptions.TimeoutException 。

import selenium.webdriver.support.ui as UI

def test_text_saver(self):
    driver = self.driver
    wait = UI.WebDriverWait(driver, 5000)
    with open("textsave.txt","w") as textsave:
        list_of_links = driver.find_elements_by_xpath("//*[@id=\"learn-sub\"]/div[4]/div/div/div/div[1]/div[2]/div/div/ul/li/a")
        for link in list_of_links:  # 2
            link.click()   # 1
            text = wait.until(
                lambda driver: driver.find_element_by_xpath("//*[@id=\"learn-sub\"]/div[4]/div/div/div/div[1]/div[1]/div[1]/h1").text)
            textsave.write(text+"\n\n")
            driver.back()

单击该链接后，您应该等到链接的URL加载。 所以对wait.until的调用直接放在link.click()
而不是使用
```
 while x <= link_count: ... x += 1 
```
最好使用
```
 for link in list_of_links: 
```
有人认为，它提高了可读性。 而且，你真的不需要关心数字x ，你真正关心的是循环遍历链接，这就是for-loop所做的。

使用Selenium Webdriver（Python）循环链接

问题描述

1 个解决方案

解决方案1
3 已采纳 2014-03-10 19:49:09

使用Selenium Webdriver（Python）循环链接

问题描述

1 个解决方案

解决方案1 3 已采纳 2014-03-10 19:49:09

解决方案1
3 已采纳 2014-03-10 19:49:09