[英]html parsing problem using C#
HTML Agility Pack将为您节省很多麻烦。 尝试使用它,而不是使用正则表达式来解析HTML。
值得一说的是,在链接到报价数据的页面中的确使用Javascript代码,请查看http://www.nseindia.com/js/getquotedata.js和http://www.nseindia.com/js/quote_data .js
根据@Vinko Vrsalovic的回答, Html Agility pack是您的朋友。 这是一个样本
WebClient client = new WebClient();
string source = client.DownloadString(url);
HtmlAgilityPack.HtmlDocument document = new HtmlAgilityPack.HtmlDocument();
document.LoadHtml(source);
HtmlNodeCollection nodes = document.DocumentNode.SelectNodes("//*[@href]");
foreach (HtmlNode node in nodes)
{
if (node.Attributes.Contains("class"))
{
if (node.Attributes["class"].Value.Contains("StockData"))
{// Here is our info }
}
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.