[英]AngleSharp Parsing [UWP]
我的 HTML 代码是
<tr>
<td colspan="8" class="text">
<B>Total</B>:
</td>
<td class="text">
<b> 1 GB</b>
</td>
<td class="text">
<b> 1.8 GB</b>
</td>
</tr>
现在我想获取具有 class="text" 的 td 标签内的数据。
在 python 中,我会这样做:
historySoup = BeautifulSoup(html)
table = historySoup.find('td', attrs={
"colspan": "8",
"class": "text"
}).parent
tds = table.findAll('td')
puts(tds[1].text)
puts(tds[2].text)
但我坚持使用 AngelSharp.I 试过这个:
var parser = new HtmlParser();
var document = parser.Parse(myhtml);
var blueListItemsCssSelector = document.QuerySelectorAll("td[colspan = '3']");
foreach (var item in blueListItemsCssSelector)
{
item.GetElementsByClassName("text");
var x = item.Text();
}
但我只是在 x 中得到文本,然后循环结束。知道如何访问 tr 的内部 td 标签并将它们的文本存储在列表或数组中吗?此外,解析任何其他方法也需要时间,因为我的 html包含 200 多个 td 标签
嘿,你做对了! 在你的 C# 代码中添加这个
List<string> dataList = new List<string>();
foreach (var item in blueListItemsCssSelector)
{
var x = item.NextElementSibling;
dataList.Add(x.Text());
var y = x.NextElementSibling;
dataList.Add(y.Text());
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.