簡體   English   中英

使用Python 3和BeautifulSoup 4轉到下一頁

[英]Going to the next page using Python 3 and BeautifulSoup 4

我正在嘗試使用Python 3和BeautifulSoup 4從網站的多個頁面上的表中解析數據,但是一切工作正常,除了某些頁面的表超出了頁面的長度。 該頁面僅顯示20個條目,要獲取其他條目,需要單擊表底部的“下一步”以移至下一個表數據繼續的頁面。 我嘗試使用

nextPage = re.compile(b'Next</a>')

nextPageUrl = nextPage.findall(webContent)

我知道這不是BeautifulSoup。 我嘗試了此操作,因為我不知道如何使用BeutifulSoup進行此操作。 但是,它不起作用。 有人可以幫我,建議我如何獲取下一頁網址以繼續抓取? 感謝您提出的任何建議。

soup = BeautifulSoup(webContent)
a = soup.find('a', href=True, text=re.compile("Next"))
if a:
    link = a["href"]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM