簡體   English   中英

在beautifulsoup Python中的錨標記之間提取文本?

[英]Extracting text between anchor tag in beautifulsoup Python?

我試圖提取此fandango頁上列出的電影的名稱。

names_tag = soup.findAll('a', {'class': 'dark showtimes-movie-title'})

這是保留名稱的錨定類。問題是,當我運行代碼時,輸​​出為:

<a class="dark showtimes-movie-title" href="http://www.fandango.com/godzilla3d_170083/movieoverview">Godzilla 3D</a>

當我在哥斯拉3D中想要的一切時。 如何成功解析此數據?

#anchor element containing the names of each movie
names_tag = soup.findAll('a', {'class': 'dark showtimes-movie-title'})
names_tag = str(names_tag)

movie_name = names_tag.split(',')

for each_line in movie_name:
    movie_names.append(each_line)

i = 0
while (i < len(movie_names)):

    print 'The length of %s is %s' %(movie_names[i], movie_times[i])

    i+=1

使用text屬性:

names_tag = soup.findAll('a', {'class': 'dark showtimes-movie-title'})
names = [name_tag.text for name_tag in names_tag]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM