[英]How to extract content of html tags from a string using javascript or angularjs?
[英]Extract and replace content from multiple HTML tags in Javascript
我正在使用javascript中的新插件进行工作,该插件使用Ajax请求加载HTML页面,从页面中提取所有脚本,然后在所有内容加载完毕后执行它。 为此,我正在尝试类似的事情:
var scripts = '',
domResponse = $('<div/>').append(HTMLresponse
.replace(/<\s*script\s*([^>]*)>((.|\n)*)<\s*\/\s*script>/i, function($0,$1,$2){
scripts += $2;
return '';
}));
// Then I load the content and I execute scripts
当我尝试包含单个脚本标签的页面时,它可以很好地工作,但是如果我尝试以下页面:
<script>
// Some javascript
</script>
<!-- SOME HTML -->
<script>
// Another script
</script>
domResponse为空,脚本包含第一个<script>和最后一个</ script>之间的文本。
有什么解决方案可以使其正常工作吗?
如果我了解您要尝试执行的操作,那么这行得通吗?
var scriptElements = document.getElementsByTagName("script");
var scripts = "";
for(var i = 0; len = scriptElements.length; i < len; i++) {
scripts += scriptElements[i].innerHTML;
scriptElements[i].innerHTML = "";
}
// load content and execute scripts
像其他人一样,我建议不要将正则表达式用于任何与HTML相关的内容。
但是,尽管如此,我仍然可以回答您的问题。 , as long as it ends with </script>
. 您的问题是您正在使用贪婪的量词,即(.|\\n)*
,只要以</script>
结尾, “吃” 。 , like this: 您想要的是一个 ,例如:
<\s*script\s*([^>]*)>((.|\n)*?)<\s*\/\s*script>
参见此处: http : //rubular.com/r/U2vvOW6XfZ 。
请注意,如果脚本标记中的任何属性包含>
,则正则表达式将中断。 如果脚本由于某种原因在其中包含</script>
(可能在注释中); 如果页面通常已经注释掉了脚本; 等。这就是使用解析器更好的原因。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.