簡體   English   中英

如何在其子串中解析帶有html標記的字符串,粗體,斜體,下划線

[英]how to parse a string with html tags in its substrings which are bold, italic, underlined

我在c#中為2D圖形框架創建了一些文本渲染工具。

現在我試圖解析其中包含特定html標簽的文本,例如:

"Hello <b>world</b>!" 

但是解析代碼變得丑陋而且我想,必須有一些lib就是這樣做的。 最后它應該輸出一組數據結構,如:

string text;
bool IsBold;
bool IsItalic;
bool IsUnderlined;
...

要么

string text;
FontStyle FontStyle;

有人知道這樣的解析器嗎?

非常感謝!

HTML Agility Pack是一個很好的HTML解析器(也可以解析片段)。

您可以使用XPath語法查詢它(它類似於XmlDocument) - 不確定它對您的要求有多適合。

我不知道這是如何工作的,但這里有一些HTML解析器:
html_parse
htmlagilitypack

Tidy.net是一個很棒的工具,它是原始Tidy項目的一個端口,用於HTML Tidy firefox插件。 通過Tidy運行您的代碼,它將返回干凈,兼容的HTML。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM