[英]Remove unnecessary repeated tags with BeautifulSoup
我正在使用Python和BeautifulSoup從html中提取一些文本。 我有一些HTML格式的文本
<h3><b> Abc </b><b> DEF </b> </h3>
我想刪除重復的b標簽。 有快速的方法嗎?
對於bs4,這似乎工作得很好
In [4]: soup.h3
Out[4]: <h3><b> Abc </b><b> DEF </b> </h3>
In [5]: soup.h3.text
Out[5]: u' Abc DEF '
在這里查看文檔和包: https : //beautiful-soup-4.readthedocs.org/en/latest/ https://pypi.python.org/pypi/beautifulsoup4
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.