繁体   English   中英

我正在使用 htmlagilitypack 从网站中提取一些数据,但我不知道发生了什么问题?

[英]I'm using htmlagilitypack to extract some data from a website but I can't figure out what issue happen?

string Url = "https://www.rottentomatoes.com/browse/dvd-all/?services=netflix_iw";
HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlWeb().Load(Url);

foreach ( var node in htmlDoc.DocumentNode.SelectNodes("/html/body[@class='body  ']/div[@class='body_main container']/div[@id='main_container']/div[@id='main-row']/div[@id='content-column']/div[@id='movies-collection']/div[@class='mb-movies list-view']/div[@class='mb-movie']"))
{
    string movieTitle = node.InnerText;
    richTextBox1.Text += movieTitle + System.Environment.NewLine;
}

我想从这个 URL 导航 XPath 中提取所有电影标题。 VS 说我没有对象引用。 为什么? 在这种特殊情况下,你能帮我试试吗?

以下代码对我有用:

string Url = "https://www.rottentomatoes.com/browse/dvd-all/?services=netflix_iw";
HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlWeb().Load(Url);

IEnumerable<string> movieTitles = from movieNode in htmlDoc.DocumentNode.Descendants()
                                  where movieNode.GetAttributeValue("class", "").Equals("movieTitle")
                                  select movieNode.InnerHtml;

它使用 LINQ 访问包含电影标题的节点。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM