在 Django 中对富文本字段使用安全过滤器

Question

我正在将TinyMCE编辑器用于Django表单中的 textarea 文件。

现在，为了向用户显示富文本，我被迫在 Django 模板中使用“安全”过滤器，以便可以在浏览器上显示 HTML 富文本。

假设在用户的浏览器上禁用了 JavaScript，TinyMCE 将不会加载并且用户可以从这样的 textarea 字段传递<script>或其他XSS标签。 这样的 HTML 不能安全地显示给用户。

我如何处理这种不是来自 TinyMCE 的不安全 HTML 文本？

Answer 1

您关心原始 HTML 是正确的，但不仅仅是针对禁用 Javascript 的浏览器。 在考虑服务器的安全性时，您必须忽略在浏览器中完成的任何工作，而只看服务器接受什么以及对它发生了什么。 您的服务器接受 HTML 并将其显示在页面上。 这是不安全的。

TinyMce 引用 HTML 的事实是一种虚假的安全性：服务器信任它接受的内容，而不信任它。

对此的解决方案是在 HTML 到达时对其进行处理，以删除危险的结构。 这是一个需要解决的复杂问题。 查看XSS 备忘单，了解可能导致问题的各种输入。

lxml 有一个清理 HTML 的功能： http : //lxml.de/lxmlhtml.html#cleaning-up-html ，但我从未使用过它，所以我不能保证它的质量。

Answer 2

使用django-bleach 。 这为您提供了一个bleach模板过滤器，允许您仅过滤掉您想要的标签：

{% load bleach_tags %}
{{ mymodel.my_html_field|bleach }}

诀窍是配置编辑器以生成与您愿意在漂白设置中“通过”相同的标签。

这是我的漂白设置示例：

# Which HTML tags are allowed
BLEACH_ALLOWED_TAGS = ['p', 'h3', 'h4', 'em', 'strong', 'a', 'ul', 'ol', 'li', 'blockquote']
# Which HTML attributes are allowed
BLEACH_ALLOWED_ATTRIBUTES = ['href', 'title', 'name']
BLEACH_STRIP_TAGS = True

然后，您可以配置 TinyMCE（或您正在使用的任何 WYSIWYG 编辑器），仅使用创建允许标签的按钮。

Answer 3

您可以使用模板过滤器“ removetags ”并删除“脚本”。

请注意， removetags已从 Django 2.0 中删除。 这是文档中的弃用通知：

1.8 版后已弃用： removetags不能保证 HTML 安全输出，出于安全考虑已弃用。 考虑使用bleach代替。

Answer 4

这个没有很好的答案。 TinyMCE 生成 HTML，django 的自动转义专门删除 HTML。

这个问题的传统解决方案是在用户输入端使用一些非 html 标记语言（bbcode、markdown 等），或者将有限数量的 HTML 标签列入白名单。 TinyMCE/HTML 通常只是适合或多或少受信任用户的输入解决方案。

白名单方法很难在没有任何安全漏洞的情况下实现。 您不想做的一件事就是尝试只检测“坏”标签——您将错过边缘情况。

在 Django 中对富文本字段使用安全过滤器

问题描述

4 个解决方案

解决方案1
14 2009-09-12 12:26:04

解决方案2
13 2014-12-17 10:45:04

解决方案3
6 2010-07-31 01:36:21

解决方案4
3 2009-09-12 12:27:11

在 Django 中对富文本字段使用安全过滤器

问题描述

4 个解决方案

解决方案1 14 2009-09-12 12:26:04

解决方案2 13 2014-12-17 10:45:04

解决方案3 6 2010-07-31 01:36:21

解决方案4 3 2009-09-12 12:27:11

解决方案1
14 2009-09-12 12:26:04

解决方案2
13 2014-12-17 10:45:04

解决方案3
6 2010-07-31 01:36:21

解决方案4
3 2009-09-12 12:27:11