簡體   English   中英

如何將HTML字符串加載到Webkit.net中,以便可以訪問其“ DOM”

[英]How can I load an HTML string into Webkit.net so I can access its “DOM”

我想使用Webkit.net加載(X)HTML字符串,然后分析DOM以“壓縮”它(刪除空格,換行符,將<input></input><input /><input> (基本上是XHTML到HTML的轉換,允許使用doctype)。

無論如何,要在webkit.net中獲取“ DOM樹”嗎? 如果不是,是否有任何.net HTML解析器可以做到這一點? 如果沒有,是否存在已經按照我的要求執行的.net組件?

一些偽代碼解釋了我想做什么:

var DOM = Webkit.DOM.FromString("<!DOCTYPE HTML><html><head><title> Hello</title></head><body><INPUT Value="Click here"  type="submit" /><br /><span class='bold red'>An element!</span><script type='text-javascript'>/*do stuff*/</script>  <script>/*do more stuff*/</script></body></html>");

var sb = new StringBuilder();

// this would recursively iterate over all childnodes in a real scenario.
foreach(var node in DOM.Nodes){
    sb.Append(/* Compress & sort attributes, normalize & strip unneeded quotes, remove unneeded end & self-closing tags, etc. */);
}

// return optimally compressed output...
// something like:
// <!doctype html><title>Hello</title><input type=submit value="Click here"><br><span class="bold red">An element!</span><script>/*do stuff*/</script><script>/*do more stuff*/</script>
return sb.ToString();

沒有使用過Webkit.Net,但是我使用了HTMLAgilityPack來完成與您所想的相似的任務,並且效果很好。 所以我認為您回答了自己的問題。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM