[英]Retrieve Html attributes using Regex
我需要一种快速的方法将一堆html属性放入Dictionary中。 像这样
<body topmargin=10 leftmargin=0 class="something"> should amount to
attr["topmargin"]="10"
attr["leftmargin"]="0"
attr["class"]="something"
这是在服务器端完成的,标签内容已经可用。 我只需要清除没有价值的标签,并考虑到不同的引号或缺少。
我猜应该使用正则表达式。 发现了一些类似的问题,但没有一个真正符合我的需求。
谢谢
编辑:澄清服务器端
HtmlAgilityPack怎么样?
我也认为使用专门的解析器会更好,但是如果你想使用正则表达式,请尝试以下方法:
\<(?<tag>[a-zA-Z]+)( (?<name>\w+)="?(?<value>\w+)"?)*\>
我刚试过它,效果很好
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.