[英]Python lxml.html linebreaks?
我正在使用lxml.html.cleaner從輸入文本中清除html。 如何在lxml.html中將\\n
更改為<br />
?
相當簡單,有點hacky的方法:假設您使用了lxml.html.parse
或任何一種構建DOM的方法,都可以在兩步過程中完成此操作。
iterdescendants
方法,該方法為您提供了所有內容。 lxml.html.clean
正常 一種更復雜的方法是對lxml.html.clean
模塊進行修補。 與許多lxml
不同,此模塊是用Python編寫的,並且相當容易訪問。 例如,當前有一個_substitute_whitespace
函數。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.