[英]Python lxml.html linebreaks?
我正在使用lxml.html.cleaner从输入文本中清除html。 如何在lxml.html中将\\n
更改为<br />
?
相当简单,有点hacky的方法:假设您使用了lxml.html.parse
或任何一种构建DOM的方法,都可以在两步过程中完成此操作。
iterdescendants
方法,该方法为您提供了所有内容。 lxml.html.clean
正常 一种更复杂的方法是对lxml.html.clean
模块进行修补。 与许多lxml
不同,此模块是用Python编写的,并且相当容易访问。 例如,当前有一个_substitute_whitespace
函数。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.