繁体   English   中英

使用Python从HTML扩展歌曲的长度和大小

[英]Extracing song length and size from HTML using Python

我正在从网站制作一个简单的mp3下载器。 这样做时,我在解析音频的时间和大小时遇到​​了麻烦:

<div class="mp3-info">
    1.69 mins
<br/>
    2.33 mb
</div>

现在我需要从上面的HTML解析1.69 mins2.33 mb 我正在使用python 3.4

我将使用BeautifulSoup4来解析您的HTML。 在这里查看文档。

import BeautifulSoup
soup = BeautifulSoup.BeautifulSoup(your_html_string)
soup.findAll("div", {"class": "mp3-info"})
# Now extract the text

另外,因为它是一类,所以页面上可能有多个...

您可以使用lxml库从HTML提取文本。

这是有关StackOverflow的问题https://stackoverflow.com/a/4624146/315168

在获得长度和大小作为文本输出之后,然后将它们分成几部分。 例如

 text = ... extract element text using lxml
 minutes, min_suffix, megabytes, mega_suffix = text.split()

 seconds = float(minutes) * 60.0

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM