Python无法从网页获取链接

Question

I am writing python script which gets links from website. 我正在编写从网站获取链接的python脚本。 But when I tried with this web page I was unable to get links. 但是，当我尝试使用此网页时，我无法获得链接。 My script is: 我的脚本是：

soup = BeautifulSoup(urllib2.urlopen(url))

datas = soup.findAll('div', attrs={'class':'tsrImg'})
for data in datas:
    link = data.find('a')
    print str(link.href)

it prints only None, can anyone explain why it is so??? 它只打印None，任何人都可以解释为什么会这样吗？？？

Answer 1

Change: 更改：

str(link.href)

With: 带有：

link.get('href')

It will look like this: 它看起来像这样：

from BeautifulSoup import BeautifulSoup
import urllib2

url = 'http://www.meinpaket.de/de/shopsList.html?page=1'
soup = BeautifulSoup(urllib2.urlopen(url))
datas = soup.findAll('div', {'class':'tsrImg'})
for data in datas:
    link = data.find('a')
    print link.get('href')

Outputs: 输出：

/de/~-office-partner-gmbh-;jsessionid=11957F27FC2D888A34532D9848C922FB.as03
/de/~-24selling-de;jsessionid=11957F27FC2D888A34532D9848C922FB.as03
/de/~abalisi-kuenstlerbedarf-shop;jsessionid=11957F27FC2D888A34532D9848C922FB.as03
/de/~abcmeineverpackung-de-kg;jsessionid=11957F27FC2D888A34532D9848C922FB.as03
/de/~ability;jsessionid=11957F27FC2D888A34532D9848C922FB.as03
/de/~ac-foto-handels-gmbh;jsessionid=11957F27FC2D888A34532D9848C922FB.as03
/de/~ac-sat-corner-inh-dirk-hahn;jsessionid=11957F27FC2D888A34532D9848C922FB.as03
/de/~adamo-fashion-gmbh-shop;jsessionid=11957F27FC2D888A34532D9848C922FB.as03
/de/~adapter-markt;jsessionid=11957F27FC2D888A34532D9848C922FB.as03
/de/~adko;jsessionid=11957F27FC2D888A34532D9848C922FB.as03

Python无法从网页获取链接

问题描述

1 个解决方案

解决方案1
5 已采纳 2012-04-02 11:08:36

Python无法从网页获取链接

问题描述

1 个解决方案

解决方案1 5 已采纳 2012-04-02 11:08:36

解决方案1
5 已采纳 2012-04-02 11:08:36