簡體   English   中英

使用Python從HTML擴展歌曲的長度和大小

[英]Extracing song length and size from HTML using Python

我正在從網站制作一個簡單的mp3下載器。 這樣做時,我在解析音頻的時間和大小時遇到​​了麻煩:

<div class="mp3-info">
    1.69 mins
<br/>
    2.33 mb
</div>

現在我需要從上面的HTML解析1.69 mins2.33 mb 我正在使用python 3.4

我將使用BeautifulSoup4來解析您的HTML。 在這里查看文檔。

import BeautifulSoup
soup = BeautifulSoup.BeautifulSoup(your_html_string)
soup.findAll("div", {"class": "mp3-info"})
# Now extract the text

另外,因為它是一類,所以頁面上可能有多個...

您可以使用lxml庫從HTML提取文本。

這是有關StackOverflow的問題https://stackoverflow.com/a/4624146/315168

在獲得長度和大小作為文本輸出之后,然后將它們分成幾部分。 例如

 text = ... extract element text using lxml
 minutes, min_suffix, megabytes, mega_suffix = text.split()

 seconds = float(minutes) * 60.0

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM