繁体   English   中英

使用 Python 和 Beautiful Soup

[英]Using Python and Beautiful Soup

我正在做一个 CA,我必须使用漂亮的汤来解析页面,我用代码做了

r = urlopen(url)    # download the page
res1 = str(r.read()) # put the content into a variable
soup = BeautifulSoup(res1,'html.parser')
for link in soup.find_all('a'):
    print(link.get('href'))

但后来我必须打印有多少不同的页面被抓取。

有人给我提示吗?

非常感谢

正如评论中提到的@cricket_007,您当前的代码“抓取”(即检索)只有一页。

如果您需要打印您在文档中找到了多少个链接,您可以这样做

print(len(soup.find_all('a')))

请注意, soup.find_all('a')是相应标签的列表,因此它的len为您提供了许多链接。

如果您真的需要抓取网站(例如,检索页面、从该页面获取所有链接、跟踪每个链接、检索它所指的页面等等),我建议使用RoboBrowser而不是“纯”BeautifulSoup。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM