繁体   English   中英

如何使用 requests-html 获取 web 页面上的所有链接

[英]How do I get all the links on a web page using requests-html

我是 web 解析的新手,我想制作一个程序来获取 web 页面上的所有内部和外部链接,我根本不知道该怎么做,我所写的就是这个

from requests_html import *

sss = HTMLSession()
k = sss.get('https://en.wikipedia.org/wiki')
hhh = HTML(html=k.html.html)
print(hhh.find('href'))

我不知道为什么当href标签无处不在时它会打印[]提前谢谢你

您可以使用下面的代码获取所有内部和外部链接。 该代码将所有相对链接转换为绝对链接。

from requests_html import HTMLSession

base_url = 'https://en.wikipedia.org'
sss = HTMLSession()
k = sss.get('https://en.wikipedia.org/wiki')
links = k.html.absolute_links
print(links)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM