[英]How to extract br text from span element?
使用Beautiful Soup v4,我的span
如下:
<span style="color: grey;">32.44 MB<br/>10454 Downloads<br/>35:25 Mins<br/>128kbps Stereo</span>
我想单独提取br
元素的文本。 我该怎么做?
尝试这个:
from bs4 import BeautifulSoup
txt = '''<span style="color: grey;">32.44 MB<br/>10454 Downloads<br/>35:25 Mins<br/>128kbps Stereo</span>'''
soup = BeautifulSoup(txt, 'html.parser')
for tag in soup.select('span br'):
print(tag.next)
输出:
10454 Downloads
35:25 Mins
128kbps Stereo
虽然这可能不是正确的方法,但是如果您将跨度用作字符串,则可以提取如下单词:
user_input = '<span style="color: grey;">32.44 MB<br/>10454 Downloads<br/>35:25 Mins<br/>128kbps Stereo</span>'.split( "<br/>" )
WordList = []
for word in user_input:
if ">" in word:
word = word[word.index(">")+1:]
if word:
WordList.append( [word] )
print(WordList)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.