使用C＃解析HTML的问题

Question

从这里开始，我尝试每隔10分钟从股票报价中获取数据。

我使用WebClient下载页面内容并使用正则表达式进行解析。 对于其他网址，它工作正常。 对于特殊URL ，我的解析代码不起作用。

我认为这是javascript的问题，当我在浏览器中加载页面时，加载页面内容后，花了一些额外的时间来绘制数据。 可能是这个人为此页面使用了一些客户端脚本。 谁能帮我...

Answer 1

HTML Agility Pack将为您节省很多麻烦。 尝试使用它，而不是使用正则表达式来解析HTML。

值得一说的是，在链接到报价数据的页面中的确使用Javascript代码，请查看http://www.nseindia.com/js/getquotedata.js和http://www.nseindia.com/js/quote_data .js

Answer 2

根据@Vinko Vrsalovic的回答， Html Agility pack是您的朋友。 这是一个样本

  WebClient client = new WebClient();
  string source = client.DownloadString(url);

  HtmlAgilityPack.HtmlDocument document = new HtmlAgilityPack.HtmlDocument();
  document.LoadHtml(source);

  HtmlNodeCollection nodes = document.DocumentNode.SelectNodes("//*[@href]");

   foreach (HtmlNode node in nodes)
   {
    if (node.Attributes.Contains("class"))
    {
     if (node.Attributes["class"].Value.Contains("StockData"))
     {// Here is our info }
    }
   }

使用C＃解析HTML的问题

问题描述

2 个解决方案

解决方案1
4 已采纳 2010-02-20 12:44:20

解决方案2
2 2010-02-20 14:04:22

使用C＃解析HTML的问题

问题描述

2 个解决方案

解决方案1 4 已采纳 2010-02-20 12:44:20

解决方案2 2 2010-02-20 14:04:22

解决方案1
4 已采纳 2010-02-20 12:44:20

解决方案2
2 2010-02-20 14:04:22