繁体   English   中英

如何使用正则表达式获取在锚标记中包含.xls或.xlsx文本的href文本

[英]How to get href text which contains .xls or .xlsx text in an anchor tag using regex

使用正则表达式,我想获取包含.xls或.xlsx文本的href

我想坚持这个正则表达式

<a\s*[^>]*\s*href\s*=\s*((?:[^ ]|[\n\r])+)\s*[^>]*>.*?<\/a>

但是我应该在这里添加些什么,以便我只能获得锚定标记中包含.xls或.xlsx文本的链接。

这样做会导致很多潜在的问题,但是要使用JavaScript:

var re = new RegExp(/<a\s*[^>]*\s*href\s*=\s*((?:[^ ]|[\n\r])+)((\.xls)|(\.xlsx))\s*[^>]*>.*?<\/a>/ig);
txt = 'ok, here you go: <a href="test.xls">test file</a> and <a href="http://not.test.com">not file</a>, but another <a href = "http://www.xls.com/test.xls">test file</a>!';
txt.match(re)

=> ['<a href="test.xls">test file</a>', '<a href = "http://www.xls.com/test.xls">test file</a>']

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM