[英]JavaScript Regexp - allowing carriage return lets other unwanted characters validate
[英]Javascript RegExp returning unwanted characters
我有这个字符串:
<AdParameters>
<VpaidClickThrough><![CDATA[http://media.adrcdn.com/ads/exit.html]]></VpaidClickThrough>
<VpaidClickTracking><![CDATA[]]></VpaidClickTracking>
<VpaidPath><![CDATA[http%3A%2F%2Fmedia.adrcdn.com%2Fads%2FAdrime%2F3130343734%2F61112%2F]]></VpaidPath>
<VpaidDuration><![CDATA[]]></VpaidDuration>
<VpaidId><![CDATA[e322f52bc813f05beacb6fe522a52f20]]></VpaidId>
</AdParameters>
<MediaFiles>
<MediaFile id="0" maintainAspectRatio="false" scalable="false" delivery="progressive" width="640" height="360" apiFramework='VPAID' type="application/x-shockwave-flash"> <![CDATA[http%3A%2F%2Fmedia.adrcdn.com%2Fads%2FAdrime%2F3130343734%2F61112%2Fmediafile_lineair_640x360.swf?VpaidId=e322f52bc813f05beacb6fe522a52f20&VpaidPath=http%3A%2F%2Fmedia.adrcdn.com%2Fads%2FAdrime%2F3130343734%2F61112%2F]]></MediaFile>
<MediaFiles>
我想从这里提取所有ENCODED URL。 所以我正在使用这个RegExp:
(http\%3A.*)\?|(http\%3A.*)\]\]
但我得到的是:
http%3A%2F%2Fmedia.adrcdn.com%2Fads%2FAdrime%2F3130343734%2F61112%2F]]
http%3A%2F%2Fmedia.adrcdn.com%2Fads%2FAdrime%2F3130343734%2F61112%2Fmediafile_lineair_640x360.swf?
http%3A%2F%2Fmedia.adrcdn.com%2Fads%2FAdrime%2F3130343734%2F61112%2F]]
这很好,但我不想要最后的“]]和”?“ 如何获取没有这些结束字符的URL?
这很奇怪,因为在这里尝试我的正则表达式http://regex101.com/r/zS0tZ8它看起来完美无缺。
先感谢您。
在regex101中,我相信你正在考虑被捕获的群体,但这并不是所有的正则表达式返回: 匹配本身将是整个正则表达式所匹配的,而不仅仅是括号内的内容。
这基本上意味着您必须解决问题:
返回第一个捕获的组 。 您的正则表达式可以正常工作,您只需返回正确的捕获值即可。 (BTW,无需逃避]]
。您可以使用(http%3A.*?)(?:\\?|]])
对其进行分解, (?: )
:)是非捕获组)
编辑你的正则表达式,以便结束分隔符不是匹配的一部分 。 看起来像前面的东西可以工作,比如http%3A.*?(?=\\?|]])
(注意不再需要括号),但你可以用以下方法实现同样的目的:
http%3A[^]?]*
[^ ]
意思是“括号内的东西”。
有很多解决方案,但这是我更喜欢的:
http%3A[\w%.]*
这只是匹配有效编码URL中的内容,而不用担心之后会发生什么。
http%3A.*?(?=\?|]])
应该做的工作
编辑:小解释:
(?=regex)
...测试正则表达式而不将结果添加到匹配项中。 它被称为“积极前瞻”。
我不确定你是如何使用你的RegExp的,但这应该有效:
function extractEncodedURLs(str) {
var pattern = /(http%3A.*?)(\?|]])/g;
var results = [];
var match;
while (match = pattern.exec(str)) {
results.push(match[1]);
}
return results;
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.