繁体   English   中英

AngleSharp 解析 [UWP]

[英]AngleSharp Parsing [UWP]

我的 HTML 代码是

  <tr>
    <td colspan="8" class="text"> 
     <B>Total</B>: 
    </td>   
      <td class="text">
          <b> 1 GB</b>
     </td>
      <td class="text">
          <b> 1.8 GB</b>
     </td>
   </tr>

现在我想获取具有 class="text" 的 td 标签内的数据。

在 python 中,我会这样做:

historySoup = BeautifulSoup(html)
table = historySoup.find('td', attrs={
    "colspan": "8",
    "class": "text"
}).parent
tds = table.findAll('td')
puts(tds[1].text)
puts(tds[2].text)

但我坚持使用 AngelSharp.I 试过这个:

   var parser = new HtmlParser();              
             var document = parser.Parse(myhtml);            
             var blueListItemsCssSelector = document.QuerySelectorAll("td[colspan = '3']");
              foreach (var item in blueListItemsCssSelector)
            {                   
                item.GetElementsByClassName("text");
                var x = item.Text();

            }

但我只是在 x 中得到文本,然后循环结束。知道如何访问 tr 的内部 td 标签并将它们的文本存储在列表或数组中吗?此外,解析任何其他方法也需要时间,因为我的 html包含 200 多个 td 标签

嘿,你做对了! 在你的 C# 代码中添加这个

List<string> dataList = new List<string>();
foreach (var item in blueListItemsCssSelector)
            {

                var x = item.NextElementSibling;
                dataList.Add(x.Text());
                var y = x.NextElementSibling;
                dataList.Add(y.Text());

            }

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM