繁体   English   中英

如何防止在Markdown中使用的漂白>(blockquote)标签

[英]How to prevent bleach from escaping > (blockquote) tag used in Markdown

我正在使用漂白剂来消毒用户输入。 但我使用Markdown这意味着我需要使用blockquote>符号而不会被转义为> 所以我可以将它传递给misaka进行渲染。

默认情况下,文档说它会转义html标记,但没有说明如何关闭>符号。 我仍然希望它能够逃避实际的html标签。

http://bleach.readthedocs.org/en/latest/clean.html

在维护使用Markdown的能力的同时保护输入的任何其他想法将不胜感激。

Bleach是一种HTML消毒剂,而不是Markdown消毒剂。 正如解释在这里 ,你应该首先运行通过降价的用户输入,然后通过漂白。 像这样:

sanitized_html = bleach.clean(markdown.markdown(some_text))

有关详细信息,请参阅我之前引用的评论

你需要剥离所有标签,但保持>原样吗?

  1. 剥离所有标签,获得输出
  2. html解码步骤1的输出,并将该数据传递给misaka

第2步的简单方法:

output.replace('>','>')

更专业

import HTMLParser
h = HTMLParser.HTMLParser()
s = h.unescape(sanitized user input)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM