簡體   English   中英

如何使用python從html個元素中提取信息

[英]How to extract information from html elements using python

我想要一個 python 腳本,它將從 html 鏈接元素 href 中提取信息。 這是示例 html 代碼:

<link rel="icon" href="https://scihub.copernicus.eu/dhus/odata/v1/Products('4c33088a-08e8-4422-9f3d-ed65411889ef')/Products('Quicklook')/$value"/>
<id>4c33088a-08e8-4422-9f3d-ed65411889ef</id>

href 屬性中的 https 鏈接是一個下載鏈接,我想要 python 腳本來自動下載。 我嘗試使用 selenium 提取數據並請求庫,但我無法取得任何進展。 我有機會找到解決方案嗎?

謝謝您的回答。

這篇文章可能會有所幫助https://www.tutorialspoint.com/downloading-files-from-web-using-python這是一個非常簡單的解決方案,使用請求 package 獲取您要下載的網站內容。 這是教程中的一個小例子:

import requests

url = 'https://www.facebook.com/favicon.ico'
r = requests.get(url, allow_redirects=True)
open('facebook.ico', 'wb').write(r.content)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM