使用循環讀取多個網頁

Question

我使用功能（movies_from_url）從網頁讀取總共256部電影。 每頁包含50部電影。 為此，我必須先閱讀6頁（250張電影需要5頁，6張電影需要6頁）。

第一個網址：

http://www.imdb.com/search/title?at=0&sort=user_rating&start=1&title_type=feature&year=2005,2014

這是我模糊的主意：

def read_m_by_rating(first_year=2005, last_year=2015, top_number=256):
    current_index=1   # current index is start number  of a webpage 
    final_list = []
    for _ in xrange(6):
    url = http://www.imdb.com/search/title?at=0&sort=user_rating&start=current_index&title_type=feature&year=2005,2014
    if top_number==300:
         lis = movies_from_url(url, top_number - current_index + 1)
    else:
         lis = movies_from_url(url, 50)

    final_list.append(lis)
    current_index=+50
    return final_list

Answer 1

只需在current_index上使用一個簡單循環即可。

while current_index<256:
    url = "http://www.imdb.com/search/title?at=0&sort=user_rating&start="\
    +str(current_index)+"&title_type=feature&year=2005,2014"
    ...
    ...
    current_index+=50
return final_list

使用循環讀取多個網頁

問題描述

1 個解決方案

解決方案1
1 已采納 2015-02-09 22:06:56

使用循環讀取多個網頁

問題描述

1 個解決方案

解決方案1 1 已采納 2015-02-09 22:06:56

解決方案1
1 已采納 2015-02-09 22:06:56