繁体   English   中英

删除 C# 中的所有内联 Javascript

[英]Remove all Inline Javascript in C#

我有一个字符串: `<p onclick="alert('abc')" style="color: black">text</p>`

我想删除所有的 Javascript,比如onclick, onchange, ...只留下 HTML 和 CSS。 有没有办法在 C# 中做到这一点? 我能想到的唯一方法是从字符串中删除每个 javascript 标记。

输入: <p onclick="alert('abc')" style="color: black">text</p>

输出: <p style="color: black ">text</p>

您可以使用HtmlSanitizer删除提供的 HTML 片段的内联 java 脚本。

例如 - 以下代码

var sanitizer = new HtmlSanitizer();
var html = @"<script>alert('xss')</script><div onload=""alert('xss')"""
    + @"style=""background-color: test"">Test<img src=""test.gif"""
    + @"style=""background-image: url(javascript:alert('xss')); margin: 10px""><p onclick =""alert('abc')"" style =""color: black"">text</p></div>";
var sanitized = sanitizer.Sanitize(html);

将输出返回为

<div>Test<img src="test.gif" style="margin: 10px"><p style="color: rgba(0, 0, 0, 1)">text</p></div>

您可以查看小提琴以获取更多详细信息。

最好的方法是使用Html Agility Pack 我已经在其文档中链接了您需要的页面。

像这样使用它:

var htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(html);
var pNode = htmlDoc.DocumentNode.SelectSingleNode("//p");   
pNode.Attributes.Remove("onclick");

是小提琴。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM