簡體   English   中英

從在線網站C#讀取html

[英]Reading html from online website C#

我正在使用C#閱讀網站,並以字符串形式獲取內容。...有些網站的HTML結構格式不正確。

我嘗試了HtmlAgilityPack和其他一些工具,但是它們需要格式正確的html,在我看來,這是不可能的。

現在,我需要一種非常簡單的方法來按Div或span id / class讀取它。

這是我的html http://jsfiddle.net/bwJU7/

請給我一個簡單的C#代碼,它將讀取

div class="item " 

並在我的html中獲取titlepricephotosdescription

如果您將內容加載為字符串並且不希望使用任何正則結構,則正則表達式將是您的朋友。

這樣的事情可能會幫助您:

String content = "Your content goes here";

var regex = new Regex("<div(?:.*?)class=\"item\"[^>]*>(.*?)</div>");
foreach (Match div in regex.Matches(content))
{               
    Console.WriteLine(div.Groups[0].Value);
}

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM