繁体   English   中英

如何从span元素中提取br文本?

[英]How to extract br text from span element?

使用Beautiful Soup v4,我的span如下:

<span style="color: grey;">32.44 MB<br/>10454 Downloads<br/>35:25 Mins<br/>128kbps Stereo</span>

我想单独提取br元素的文本。 我该怎么做?

尝试这个:

from bs4 import BeautifulSoup

txt = '''<span style="color: grey;">32.44 MB<br/>10454 Downloads<br/>35:25 Mins<br/>128kbps Stereo</span>'''

soup = BeautifulSoup(txt, 'html.parser')

for tag in soup.select('span br'):
    print(tag.next)

输出:

10454 Downloads
35:25 Mins
128kbps Stereo

虽然这可能不是正确的方法,但是如果您将跨度用作字符串,则可以提取如下单词:

user_input = '<span style="color: grey;">32.44 MB<br/>10454 Downloads<br/>35:25 Mins<br/>128kbps Stereo</span>'.split( "<br/>" )
WordList = []
for word in user_input:
    if ">" in word:
        word = word[word.index(">")+1:]
    if word:
        WordList.append( [word] )
print(WordList)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM