繁体   English   中英

从html删除span标签

[英]Removing span tags from html

您能帮我用一个代码片段(带/不带正则表达式)从这样的字符串中删除所有span标签:(Silverlight-c#)

<a href="#">
  <span class="uiTooltipWrap bottom left leftbottom">
    <span class="uiTooltipText">
      dasd dssa<br />
      adsa sssss
    </span>
  </span>
</a>

谢谢。

HTMLAgilityPack适合您。

这是一个敏捷的HTML解析器,它构建了一个读/写DOM并支持纯XPATH或XSLT(您实际上不必了解XPATH或XSLT来使用它,不用担心...)。 这是一个.NET代码库,可让您解析“网络外” HTML文件。 该解析器对“真实世界”格式的HTML十分宽容。 对象模型与提出System.Xml的对象模型非常相似,但用于HTML文档(或流)。

在Perl中,我们可能会说:

s/
  <     # tag opening character
  \/?   # optional slash
  span
  [^>]* # any non tag-closing characters
  >     # tag closing character
/
        # nothing
/x;

并且我确定您可以将其转换为C#正则表达式。 即,将与</?span[^>]*>匹配的所有内容替换为空。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM