繁体   English   中英

Python html2text文本问题

[英]Python html2text text issue

我正在使用html2text将HTML转换为文本,但是它也更改了我的文本字符串,例如A&PA&P; html2text

我如何避免这种变化

In [1]: import html2text

In [2]: conv = html2text.HTML2Text()

In [3]: conv.handle("string A&P string")
P
&P;
Out[3]: u'string A&P; string\n\n'

输出应该是

Out[3]: u'string A&P string\n\n'

这是因为您转换的字符串存在语法错误。 &应该以html语言转义。

尝试

out = conv.handle("string A&P string")

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM