[英]web scraping with python/beautiful soup
所以我正在学习如何 web 刮擦。 我目前正在尝试查找此代码中的所有社交链接
<ul class="socials">
<li class="social instagram">
<b>
Instagram:
</b>
<a href="https://www.instagram.com/keithgalli/">
https://www.instagram.com/keithgalli/
</a>
</li>
<li class="social twitter">
<b>
Twitter:
</b>
<a href="https://twitter.com/keithgalli">
https://twitter.com/keithgalli
</a>
</li>
<li class="social linkedin">
<b>
LinkedIn:
</b>
<a href="https://www.linkedin.com/in/keithgalli/">
https://www.linkedin.com/in/keithgalli/
</a>
</li>
<li class="social tiktok">
<b>
TikTok:
</b>
<a href="https://www.tiktok.com/@keithgalli">
https://www.tiktok.com/@keithgalli
</a>
</li>
显然是锚标签中的链接,但我遇到了 find_all 命令的问题,当我尝试使用它时,我只能取回其中一个社交链接。 我输入的代码是
href = soup.find_all("a")
print(href)
输出是
[<a href="https://keithgalli.github.io/web-scraping/webpage.html">keithgalli.github.io/web-scraping/webpage.html</a>]
我不确定我做错了什么。 我认为,如果我以 href 为目标,它将抓住所有的 href。任何提示或方向将不胜感激。
尝试这个:
for href in soup.find_all("a"):
print(href)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.