![](/img/trans.png)
[英]How to retrieve bold, italic and underlined words from plain text and surround them by HTML tags
[英]how to parse a string with html tags in its substrings which are bold, italic, underlined
我在c#中為2D圖形框架創建了一些文本渲染工具。
現在我試圖解析其中包含特定html標簽的文本,例如:
"Hello <b>world</b>!"
但是解析代碼變得丑陋而且我想,必須有一些lib就是這樣做的。 最后它應該輸出一組數據結構,如:
string text;
bool IsBold;
bool IsItalic;
bool IsUnderlined;
...
要么
string text;
FontStyle FontStyle;
有人知道這樣的解析器嗎?
非常感謝!
HTML Agility Pack是一個很好的HTML解析器(也可以解析片段)。
您可以使用XPath語法查詢它(它類似於XmlDocument) - 不確定它對您的要求有多適合。
我不知道這是如何工作的,但這里有一些HTML解析器:
html_parse
htmlagilitypack
Tidy.net是一個很棒的工具,它是原始Tidy項目的一個端口,用於HTML Tidy firefox插件。 通過Tidy運行您的代碼,它將返回干凈,兼容的HTML。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.