簡體   English   中英

使用正則表達式從html標記中剝離所有屬性

[英]stripping all attributes from an html tag using regex

我一直在嘗試公式化正則表達式以刪除html標記中可能存在的任何屬性,但是我在執行此操作時遇到了麻煩,Google似乎也未提供任何答案。

基本上我的輸入字符串看起來像

<p style="font-family:Arial;" class="x" onclick="doWhatever();">this text</p>
<img style="border:0px" src="pic.gif" />

並且我想刪除標簽內的所有屬性以生成類似以下的字符串:

<p>this text</p>
<img src="pic.gif" />

有人知道這樣做的正則表達式嗎? 順便說一下,我在C#中使用Regex.Replace。

確實有出色的工具可以在.NET中處理此類任務,而不必求助於正則表達式。 這也將比基於正則表達式的解決方案更可靠。

我建議您看一下HTML Agility Pack

HTML是最簡單的使用DOM進行接口的方法,但是如果您確實想使用正則表達式來執行此操作,則可以利用要刪除所有屬性的優勢,例如,除了標記之外,什么也不要留下。 IMO,您應該改用DOM解析器。

要么使用jquery要么遍歷所有html元素並刪除attr。 或來自特定元素。 你為什么要這么做呢?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM