使用BeautifulSoup抓取網站時閱讀頁碼

Question

我正在嘗試僅從URL鏈接中讀取頁號並將其放入變量中。 下面是我從網站上抓取的變量的打印輸出

<li><a href="https://bp.portwallet.com/report/topUp?source=gp_web&amp;allSearch=&amp;amountFrom=1&amp;amountTo=50000&amp;startdate=2018-10-03&amp;enddate=2018-10-03&amp;topUpSearch=topUpSearch&amp;status=1&amp;rType=Prepaid&amp;per_page=46">Last ›</a></li>

我需要將per_page =值放入變量中。

我試着只刮號碼而沒有運氣

Answer 1

from bs4 import BeautifulSoup
page = '''<li><a href="https://bp.portwallet.com/report/topUp?source=gp_web&amp;allSearch=&amp;amountFrom=1&amp;amountTo=50000&amp;startdate=2018-10-03&amp;enddate=2018-10-03&amp;topUpSearch=topUpSearch&amp;status=1&amp;rType=Prepaid&amp;per_page=46">Last ›</a></li>'''
soup = BeautifulSoup(page, 'html.parser')
x = soup.select('a')
per_page = (x[0]['href']).split('per_page=')[-1]
print('per_page:', per_page)

輸出：

per_page: 46

使用BeautifulSoup抓取網站時閱讀頁碼

問題描述

1 個解決方案

解決方案1
0 已采納 2018-10-07 05:28:34

使用BeautifulSoup抓取網站時閱讀頁碼

問題描述

1 個解決方案

解決方案1 0 已采納 2018-10-07 05:28:34

解決方案1
0 已采納 2018-10-07 05:28:34