[英]How to split an HtmlNode by <br> and then extract the InnerText from each split string?
[英]How to extract text in htmlnode?
使用敏捷性,我已经从指定的网站中提取了 htmlnode,但我无法在 htmlnode.InnerHtml 中的标签中检索数据。
HtmlNode table = doc.DocumentNode.SelectNodes("//*[@id='content_page']//table//*//td").FirstOrDefault;
我怎样才能得到这些字符串和数字?
这是我的插图! 抱歉,因为我上传照片有限。
如图所示,您的选择器选择了一组单元格,要选择第一个单元格,您需要调用 .FirstOrDefault() (注意括号)。
并且因为您选择了一个单元格(而不是表格),所以您可能不想将您选择的 HtmlNode 称为“表格”。
所以这应该有效:
HtmlNode firstCell = doc.DocumentNode.SelectNodes("//*[@id='content_page']//table//*//td").FirstOrDefault();
string firstCellText = firstCell.InnerText;
要获得数字,您将使用指向第二行的不同 xpath
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.