![](/img/trans.png)
[英]Extracting Element from html document for android app using Jsoup
[英]Extracting the property of an HTML element using RegEx
我正在处理一些图像延迟,并且正在寻找一种删除 src 元素的方法。 我有一个特定的用例,我需要使用正则表达式,以便我可以在服务器端呈现结果并停止加载 src,直到我在 JS 中告诉它。
基本上我需要一种方法来可靠地替换图像标签中的src
。 不是值,而是实际的属性名称。
截至目前,我正在测试以下内容:
<img[^>]+src\\s*=\\s*['"]([^'"]+)['"][^>]*>
。
给出我的示例文本,找到整个字符串<img src="aaaa" />
。 我基本上只需要它来突出src
。 这样我就可以 regex_replace 将src
更改为data-deferred
。
示例文本
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Duis bibendum lorem bibendum lectus rhoncus molestie. <img src ="aaaa" /> Maecenas ipsum justo, fermentum nec lacus in, porta consectetur metus.
这是我的 Regex101: https ://regex101.com/r/RATGgw/1/
因为我并不总是可以访问我将不得不解析的 HTML,所以我不能只定位src
。 我需要确保在图像标签内的任何地方找到它时它只是src
。
知道我如何修改它以实现这一目标吗?
编辑:
为了澄清问题,我如何使用 RegEx 才能仅在图像标签中找到src
属性。
所以我找到的结果将允许我用自定义数据属性替换src="https://"
,如data-deferred="https://"
。
您可以通过在正则表达式中使用捕获组(括号)来将src
属性替换为data-deferred
属性,如下所示:
// [ $1 ][$2 ][?= a lookahead (no capture) ][global - replace all] var regex = /(<img[^>]+)(src)(?=\\s*=\\s*['"][^'"]+['"][^>]*>)/g; var text = 'Lorem ipsum. <img alt="foo" src ="aaaa" title="bar" /> Maecenas metus.'; var result = text.replace(regex, '$1data-deferred'); console.log(result); // Lorem ipsum. <img alt="foo" data-deferred ="aaaa" title="bar" /> Maecenas metus.
您想将 jQuery 用于这样的事情:
$('img[data-deferred]').each(function(i, img){
$(img).attr('src', $(img).attr('data-deferred'))
})
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.