无法使用xpath从html文档获取正文节点

Question

我知道这是一个愚蠢的问题，但是我找不到它的问题。 无法使用xpath从html文档的body节点获取内部文本。

我正在使用的代码：

HtmlWeb web = new HtmlWeb();

HtmlDocument doc = web.Load(String.Format(url, companyName));

HtmlNode node = doc.DocumentNode.SelectSingleNode("//body");
string code = null;
try
{
     code = node.FirstChild.InnerText;
}
catch (NullReferenceException e)
{
}

网站结构 ：

<html>
     <body>PYRIX | preston york</body>
</html>

Answer 1

我只是尝试了node.InnerText而已。 问题必须出在如何加载文档上。

这有效：

HtmlDocument doc = new HtmlDocument();
doc.LoadHtml("<html><body>PYRIX | preston york</body></html>");

var node = doc.DocumentNode.SelectSingleNode("//body");

Console.WriteLine(node.InnerText);

无法使用xpath从html文档获取正文节点

问题描述

1 个解决方案

解决方案1
0 2015-10-12 06:21:00

无法使用xpath从html文档获取正文节点

问题描述

1 个解决方案

解决方案1 0 2015-10-12 06:21:00

解决方案1
0 2015-10-12 06:21:00