繁体   English   中英

Python:在之前之后提取文本<br/>

[英]Python:extract text after </span> before <br/>

这是我要处理的html文件:

<span class="pl">Countries:</span> USA <br/>
<span class="pl">Language:</span> English <br/>

这是我的python代码:

from bs4 import BeautifulSoup

record=[]
soup=BeautifulSoup(html)
spans=soup.find_all('span')
for span in spans:
   record.append(span.text)

我终于得到的是:

Countries: Language:

结果错过了一些重要信息:“美国”和“英语”如何获取文本?

使用.next_sibling表示法:

soup.find("span", text="Countries:").next_sibling
soup.find("span", text="Language:").next_sibling

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM