繁体   English   中英

从html文本字符串中提取图像链接

[英]Extract images link from html text string

我想提取所有图像链接,以便可以自由使用所有图像。 如何在asp.net C#中做

<div>
    <img src="/upload/Tom_Cruise-242x300.jpg" alt="Tom_Cruise-242x300.jpg" align="left" border="0" height="300" width="242">
    sample text sample text sample text sample text 
    <img src="http://www.sharicons.com/images/rss_icon.jpg" alt="Icon" align="left" border="0" height="100" width="100">
    sample text sample text sample text sample text sample text sample text sample text sample text</div>

我有解决方案

 string ProcessedText = Regex.Replace(sb.ToString(), "^<img[^>]*>", string.Empty);

您可以使用HTML Agility Pack来解析HTML并使用XPath语法(例如XmlDocument )对其进行查询。

我将使用HTML Agility Pack。
然后,您可以执行以下操作:

HtmlNodeCollection allImages = doc.DocumentNode.SelectNodes("//img[@src]");

一种简单的方法是将字符串放入名为myString的字符串中,然后运行以下代码:

List<string> imagePaths = new List<string>();
while( myString.IndexOf("img src=") >= 0 ){
  myString = myString.Substring( myString.IndexOf("img src=")+9);
  imagePaths.Add(myString.Substring(0,myString.IndexOf("\"")));
}

现在,列表imagePaths将包含所有图像链接。

您可以使用HTMLAgilityPack或第二个选项是正则表达式:)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM