[英]What regex would find out if file url has certain extension
我的有效网址可能看起来或多或少像这样
http://someurl.com/some/path/file.pdf
or
http://someurl.com/some/path/file.pdf?param=value
or
http://someurl.com/some/path/file.pdf?param=value&second=val
其中文件扩展名可以是 .pdf,或其他一些扩展名,如 .jpg 或 .psd,或者什么都没有。
我存储的 url 没有 someurl.com 部分,所以它是 url 的some/path/file.pdf
部分
如果存在文件扩展名,我如何使用正则表达式知道它? 正则表达式是正确的工具吗?
我会使用parse_url()
和pathinfo()
。 这些是工作中最正确的功能。
$url = 'http://someurl.com/some/path/file.pdf?param=value';
$path = parse_url($url, PHP_URL_PATH);
$ext = pathinfo($path, PATHINFO_EXTENSION);
var_dump($ext); // string(3) "pdf"
您可以使用正则表达式,但会更难以遵循。
您可能需要执行 HTTP HEAD 请求。 正则表达式肯定会起作用,但不能保证您能捕获所有情况。
例如:
http://someurl.com/some/path/file可能是一个没有扩展名的文本文件(就像在大多数 *nix 系统上一样)并且正则表达式将无法提供文件扩展名。
更好的选择是 PHP 的parse_url函数:
$path = parse_url($url, PHP_URL_PATH);
$extension = ($pos = strrpos($path, '.')) ? substr($path, $pos) : "";
不需要正则表达式,我们可以只使用parse_url
。
$url = parse_url('http://example.com/path/to/file.php?param=value');
$extension = substr($url['path'], strrpos($url['path'], '.') + 1);
echo $extension; // outputs "php"
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.