繁体   English   中英

正则表达式C#问题

[英]Regex c# questions

我有一个html代码。 我用这样的正则表达式解析

MatchCollection matches = Regex.Matches(go, @"photoWrapper""><div><a href=""(?<id>[^""]+?)\?");

我收到:

matches[0].Groups["id"].Value = "/group/47502002094086";
matches[1].Groups["id"].Value = "/dk";
matches[2].Groups["id"].Value = "/prostooglavnom";

如何编辑我的正则表达式或添加smth以仅在匹配项中接收

matches[0].Groups["id"].Value = "47502002094086";
matches[1].Groups["id"].Value = "prostooglavnom";

有任何帮助吗?= \\完整的html代码: http : //pastebin.com/xEJNiD4G

您刚刚为自己发现了Regex为什么不是解析HTML的不佳选择

我建议您使用HTML Agility Pack来解析和查询HTML。

源代码下载包含许多示例项目。

HTML敏捷包(HAP)到底是什么?

这是一个敏捷的HTML解析器,可构建读/写DOM并支持纯XPATH或XSLT(您实际上不必了解XPATH或XSLT即可使用它,不用担心...)。 这是一个.NET代码库,可让您解析“网络外” HTML文件。 该解析器对“真实世界”格式的HTML十分宽容。 对象模型与提出System.Xml的对象模型非常相似,但用于HTML文档(或流)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM