簡體   English   中英

Python用Selenium和Beautifulsoup抓取僅提取超鏈接href無鏈接

[英]Python scrape with Selenium and Beautifulsoup extracting hyperlink only href no link

我試圖用他們的超鏈接 URL 抓取 NBA 球員,但無論我嘗試什么,結果都只有 href 名稱和編號,任何從超鏈接中提取 URL 的方法,謝謝。

在此處輸入圖片說明

在此處輸入圖片說明

頁面上的href鏈接是相對鏈接。 當你拉出這些鏈接時,將它們存儲在一個列表中,然后遍歷這些鏈接並將網頁的 url 添加到這些鏈接中。

https://stats.nba.com/player/1628960/ url 為您提供某個球員的信息,但您的 href 列表中只有/player/1628960/ 這意味着您需要在列表中的每個條目前添加https://stats.nba.com

您可以嘗試以下操作

url = 'https://stats.nba.com'
new_links = []
for link in player list:
    new_links.append(url + link)

或者您可以在抓取這些鏈接時預先添加 url。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM