[英]Validate non-latin URLs
My client asks to validate URLs entered by users which contains non-latin characters. 我的客户要求验证用户输入的包含非拉丁字符的URL。 Example:
例:
http://uk.wikipedia.org/wiki/Фотосинтез
http://презитент.рф
Does anyone has a regexp to validate such an URLs? 是否有人使用正则表达式来验证此类URL?
Or is there a way in PHP to easily URL-encode non-Latin URL part. 还是PHP中有一种方法可以轻松地对非拉丁URL部分进行URL编码。 Ex:
http://uk.wikipedia.org/wiki/Фотосинтез
-> http://uk.wikipedia.org/wiki/%D0%A4%D0%BE%D1%82%D0%BE%D1%81%D0%B8%D0%BD%D1%82%D0%B5%D0%B7
and vice verse? 例如:
http://uk.wikipedia.org/wiki/Фотосинтез
: http://uk.wikipedia.org/wiki/Фотосинтез
> http://uk.wikipedia.org/wiki/%D0%A4%D0%BE%D1%82%D0%BE%D1%81%D0%B8%D0%BD%D1%82%D0%B5%D0%B7
,反之亦然?
Does it make any sense? 有什么意义吗?
Many thanks for help. 非常感谢您的帮助。
php.net warns that parse_url "is not meant to validate the given URL, it only breaks it up into the above listed parts." php.net 警告 parse_url“不是要验证给定的URL,它只会将其分解为上面列出的部分。” If that's acceptable, it appears to (more or less) work with non-Latin characters:
如果可以接受,那么它似乎(或多或少)适用于非拉丁字符:
~ visitor$ cat parse.php
<?php
$parsed = parse_url( 'http://uk.wikipedia.org/wiki/Фотосинтез' );
print_r( $parsed );
?>
~ visitor$ php parse.php
Array
(
[scheme] => http
[host] => uk.wikipedia.org
[path] => /wiki/Фо?_о?_ин?_ез
)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.