[英]How to extract information from html elements using python
我想要一個 python 腳本,它將從 html 鏈接元素 href 中提取信息。 這是示例 html 代碼:
<link rel="icon" href="https://scihub.copernicus.eu/dhus/odata/v1/Products('4c33088a-08e8-4422-9f3d-ed65411889ef')/Products('Quicklook')/$value"/>
<id>4c33088a-08e8-4422-9f3d-ed65411889ef</id>
href 屬性中的 https 鏈接是一個下載鏈接,我想要 python 腳本來自動下載。 我嘗試使用 selenium 提取數據並請求庫,但我無法取得任何進展。 我有機會找到解決方案嗎?
謝謝您的回答。
這篇文章可能會有所幫助https://www.tutorialspoint.com/downloading-files-from-web-using-python這是一個非常簡單的解決方案,使用請求 package 獲取您要下載的網站內容。 這是教程中的一個小例子:
import requests
url = 'https://www.facebook.com/favicon.ico'
r = requests.get(url, allow_redirects=True)
open('facebook.ico', 'wb').write(r.content)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.