[英]Remove html tags with their contents using Python
有什么選項可以刪除 html 標簽及其內容?
我只找到了將文本保留在標簽內的條形標簽功能。
我想刪除標簽及其內容。
例如: "Teste: <b> oi</b> nome"
將是"Teste: nome"
謝謝。
您可以嘗試正則表達式來實現它。
import re
s = "Teste: <b> oi</b> nome"
replaced = re.sub('<.*?>.*?</.*?>', '', s)
print(replaced)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.