繁体   English   中英

如何提取htmlnode中的文本?

[英]How to extract text in htmlnode?

使用敏捷性,我已经从指定的网站中提取了 htmlnode,但我无法在 htmlnode.InnerHtml 中的标签中检索数据。

 HtmlNode table = doc.DocumentNode.SelectNodes("//*[@id='content_page']//table//*//td").FirstOrDefault;

我怎样才能得到这些字符串和数字?

这是我的插图! 抱歉,因为我上传照片有限。

我的图片.png

如图所示,您的选择器选择了一组单元格,要选择第一个单元格,您需要调用 .FirstOrDefault() (注意括号)。

并且因为您选择了一个单元格(而不是表格),所以您可能不想将您选择的 HtmlNode 称为“表格”。

所以这应该有效:

HtmlNode firstCell = doc.DocumentNode.SelectNodes("//*[@id='content_page']//table//*//td").FirstOrDefault();
string firstCellText = firstCell.InnerText;

要获得数字,您将使用指向第二行的不同 xpath

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM