如何提取htmlnode中的文本？

Question

使用敏捷性，我已经从指定的网站中提取了 htmlnode，但我无法在 htmlnode.InnerHtml 中的标签中检索数据。

 HtmlNode table = doc.DocumentNode.SelectNodes("//*[@id='content_page']//table//*//td").FirstOrDefault;

我怎样才能得到这些字符串和数字？

这是我的插图！ 抱歉，因为我上传照片有限。

我的图片.png

Answer 1

如图所示，您的选择器选择了一组单元格，要选择第一个单元格，您需要调用 .FirstOrDefault() （注意括号）。

并且因为您选择了一个单元格（而不是表格），所以您可能不想将您选择的 HtmlNode 称为“表格”。

所以这应该有效：

HtmlNode firstCell = doc.DocumentNode.SelectNodes("//*[@id='content_page']//table//*//td").FirstOrDefault();
string firstCellText = firstCell.InnerText;

要获得数字，您将使用指向第二行的不同 xpath

如何提取htmlnode中的文本？

问题描述

1 个解决方案

解决方案1
0 已采纳 2020-10-02 06:45:11

如何提取htmlnode中的文本？

问题描述

1 个解决方案

解决方案1 0 已采纳 2020-10-02 06:45:11

解决方案1
0 已采纳 2020-10-02 06:45:11