簡體   English   中英

使用BeautifulSoup刪除不必要的重復標記

[英]Remove unnecessary repeated tags with BeautifulSoup

我正在使用Python和BeautifulSoup從html中提取一些文本。 我有一些HTML格式的文本

<h3><b> Abc </b><b> DEF </b> </h3>

我想刪除重復的b標簽。 有快速的方法嗎?

對於bs4,這似乎工作得很好

In [4]: soup.h3
Out[4]: <h3><b> Abc </b><b> DEF </b> </h3>

In [5]: soup.h3.text
Out[5]: u' Abc  DEF  '

在這里查看文檔和包: https//beautiful-soup-4.readthedocs.org/en/latest/ https://pypi.python.org/pypi/beautifulsoup4

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM