[英]Reading html from online website C#
我正在使用C#閱讀網站,並以字符串形式獲取內容。...有些網站的HTML結構格式不正確。
我嘗試了HtmlAgilityPack
和其他一些工具,但是它們需要格式正確的html,在我看來,這是不可能的。
現在,我需要一種非常簡單的方法來按Div或span id / class讀取它。
這是我的html http://jsfiddle.net/bwJU7/
請給我一個簡單的C#代碼,它將讀取
div class="item "
並在我的html中獲取title
, price
, photos
和description
。
如果您將內容加載為字符串並且不希望使用任何正則結構,則正則表達式將是您的朋友。
這樣的事情可能會幫助您:
String content = "Your content goes here";
var regex = new Regex("<div(?:.*?)class=\"item\"[^>]*>(.*?)</div>");
foreach (Match div in regex.Matches(content))
{
Console.WriteLine(div.Groups[0].Value);
}
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.