web 用python刮/美汤

Question

所以我正在学习如何 web 刮擦。 我目前正在尝试查找此代码中的所有社交链接

    <ul class="socials">
   <li class="social instagram">
    <b>
     Instagram:
    </b>
    <a href="https://www.instagram.com/keithgalli/">
     https://www.instagram.com/keithgalli/
    </a>
   </li>
   <li class="social twitter">
    <b>
     Twitter:
    </b>
    <a href="https://twitter.com/keithgalli">
     https://twitter.com/keithgalli
    </a>
   </li>
   <li class="social linkedin">
    <b>
     LinkedIn:
    </b>
    <a href="https://www.linkedin.com/in/keithgalli/">
     https://www.linkedin.com/in/keithgalli/
    </a>
   </li>
   <li class="social tiktok">
    <b>
     TikTok:
    </b>
    <a href="https://www.tiktok.com/@keithgalli">
     https://www.tiktok.com/@keithgalli
    </a>
   </li>

显然是锚标签中的链接，但我遇到了 find_all 命令的问题，当我尝试使用它时，我只能取回其中一个社交链接。 我输入的代码是

href = soup.find_all("a")
print(href)

输出是

[<a href="https://keithgalli.github.io/web-scraping/webpage.html">keithgalli.github.io/web-scraping/webpage.html</a>]

我不确定我做错了什么。 我认为，如果我以 href 为目标，它将抓住所有的 href。任何提示或方向将不胜感激。

Answer 1

尝试这个：

for href in soup.find_all("a"):
    print(href)

web 用python刮/美汤

问题描述

1 个解决方案

解决方案1
0 2022-08-21 21:37:14

web 用python刮/美汤

问题描述

1 个解决方案

解决方案1 0 2022-08-21 21:37:14

解决方案1
0 2022-08-21 21:37:14