如何将未转义的文本添加到 Python 中的 LXML Etree？

Question

LXML's builder allows for easily generation of HTML and XML , like this: LXML 的构建器允许轻松生成 HTML 和 XML ，如下所示：

>>>from lxml.builder import E
>>>import lxml.etree
>>>lxml.etree.tostring(E.html('hello'))

b'<html>hello</html>'

But if I include text that's already in HTML, it escapes the angle brackets, as it should:但是，如果我包含 HTML 中已经存在的文本，它将转义尖括号，因为它应该：

>>>lxml.etree.tostring(E.html('<b>Hello</b>'))                                                       
b'<html>&lt;b&gt;Hello&lt;/b&gt;</html>'

So how can I get it to treat the inner text as raw HTML/XML?那么我怎样才能让它将内部文本视为原始 HTML/XML 呢？ I'd like to get it to output <html><b>Hello</b></html in the above example.在上面的示例中，我想将它发送到 output <html><b>Hello</b></html 。

Answer 1

You can easily accomplish this by parsing your html string into an lxml etree object:您可以通过将 html 字符串解析为 lxml etree object 轻松完成此操作：

In [1]: from lxml.builder import E                                       

In [2]: import lxml.etree                                           

In [3]: lxml.etree.tostring(E.html(lxml.etree.fromstring('<b>Hello</b>')
Out[3]: b'<html><b>Hello</b></html>'

如何将未转义的文本添加到 Python 中的 LXML Etree？

问题描述

1 个解决方案

解决方案1
1 已采纳 2020-04-14 16:07:28

如何将未转义的文本添加到 Python 中的 LXML Etree？

问题描述

1 个解决方案

解决方案1 1 已采纳 2020-04-14 16:07:28

解决方案1
1 已采纳 2020-04-14 16:07:28