[英]Regex c# questions
我有一个html代码。 我用这样的正则表达式解析
MatchCollection matches = Regex.Matches(go, @"photoWrapper""><div><a href=""(?<id>[^""]+?)\?");
我收到:
matches[0].Groups["id"].Value = "/group/47502002094086";
matches[1].Groups["id"].Value = "/dk";
matches[2].Groups["id"].Value = "/prostooglavnom";
如何编辑我的正则表达式或添加smth以仅在匹配项中接收
matches[0].Groups["id"].Value = "47502002094086";
matches[1].Groups["id"].Value = "prostooglavnom";
有任何帮助吗?= \\完整的html代码: http : //pastebin.com/xEJNiD4G
您刚刚为自己发现了Regex为什么不是解析HTML的不佳选择 。
我建议您使用HTML Agility Pack来解析和查询HTML。
源代码下载包含许多示例项目。
HTML敏捷包(HAP)到底是什么?
这是一个敏捷的HTML解析器,可构建读/写DOM并支持纯XPATH或XSLT(您实际上不必了解XPATH或XSLT即可使用它,不用担心...)。 这是一个.NET代码库,可让您解析“网络外” HTML文件。 该解析器对“真实世界”格式的HTML十分宽容。 对象模型与提出System.Xml的对象模型非常相似,但用于HTML文档(或流)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.