简体   繁体   English

验证非拉丁网址

[英]Validate non-latin URLs

My client asks to validate URLs entered by users which contains non-latin characters. 我的客户要求验证用户输入的包含非拉丁字符的URL。 Example: 例:

  • http://uk.wikipedia.org/wiki/Фотосинтез
  • http://презитент.рф

Does anyone has a regexp to validate such an URLs? 是否有人使用正则表达式来验证此类URL?

Or is there a way in PHP to easily URL-encode non-Latin URL part. 还是PHP中有一种方法可以轻松地对非拉丁URL部分进行URL编码。 Ex: http://uk.wikipedia.org/wiki/Фотосинтез -> http://uk.wikipedia.org/wiki/%D0%A4%D0%BE%D1%82%D0%BE%D1%81%D0%B8%D0%BD%D1%82%D0%B5%D0%B7 and vice verse? 例如: http://uk.wikipedia.org/wiki/Фотосинтез : http://uk.wikipedia.org/wiki/Фотосинтез > http://uk.wikipedia.org/wiki/%D0%A4%D0%BE%D1%82%D0%BE%D1%81%D0%B8%D0%BD%D1%82%D0%B5%D0%B7 ,反之亦然?

Does it make any sense? 有什么意义吗?

Many thanks for help. 非常感谢您的帮助。

php.net warns that parse_url "is not meant to validate the given URL, it only breaks it up into the above listed parts." php.net 警告 parse_url“不是要验证给定的URL,它只会将其分解为上面列出的部分。” If that's acceptable, it appears to (more or less) work with non-Latin characters: 如果可以接受,那么它似乎(或多或少)适用于非拉丁字符:

~ visitor$ cat parse.php 
<?php
$parsed = parse_url( 'http://uk.wikipedia.org/wiki/Фотосинтез' );
print_r( $parsed );
?>

~ visitor$ php parse.php 
Array
(
    [scheme] => http
    [host] => uk.wikipedia.org
    [path] => /wiki/Фо?_о?_ин?_ез
)

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM