[英]reading multiple webpages using loop
我使用功能(movies_from_url)從網頁讀取總共256部電影。 每頁包含50部電影。 為此,我必須先閱讀6頁(250張電影需要5頁,6張電影需要6頁)。
第一個網址:
http://www.imdb.com/search/title?at=0&sort=user_rating&start=1&title_type=feature&year=2005,2014
這是我模糊的主意:
def read_m_by_rating(first_year=2005, last_year=2015, top_number=256):
current_index=1 # current index is start number of a webpage
final_list = []
for _ in xrange(6):
url = http://www.imdb.com/search/title?at=0&sort=user_rating&start=current_index&title_type=feature&year=2005,2014
if top_number==300:
lis = movies_from_url(url, top_number - current_index + 1)
else:
lis = movies_from_url(url, 50)
final_list.append(lis)
current_index=+50
return final_list
只需在current_index上使用一個簡單循環即可。
while current_index<256:
url = "http://www.imdb.com/search/title?at=0&sort=user_rating&start="\
+str(current_index)+"&title_type=feature&year=2005,2014"
...
...
current_index+=50
return final_list
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.