验证非拉丁网址

Question

My client asks to validate URLs entered by users which contains non-latin characters. 我的客户要求验证用户输入的包含非拉丁字符的URL。 Example: 例：

http://uk.wikipedia.org/wiki/Фотосинтез
http://презитент.рф

Does anyone has a regexp to validate such an URLs? 是否有人使用正则表达式来验证此类URL？

Or is there a way in PHP to easily URL-encode non-Latin URL part. 还是PHP中有一种方法可以轻松地对非拉丁URL部分进行URL编码。 Ex: http://uk.wikipedia.org/wiki/Фотосинтез -> http://uk.wikipedia.org/wiki/%D0%A4%D0%BE%D1%82%D0%BE%D1%81%D0%B8%D0%BD%D1%82%D0%B5%D0%B7 and vice verse? 例如： http://uk.wikipedia.org/wiki/Фотосинтез : http://uk.wikipedia.org/wiki/Фотосинтез > http://uk.wikipedia.org/wiki/%D0%A4%D0%BE%D1%82%D0%BE%D1%81%D0%B8%D0%BD%D1%82%D0%B5%D0%B7 ，反之亦然？

Does it make any sense? 有什么意义吗？

Many thanks for help. 非常感谢您的帮助。

Answer 1

php.net warns that parse_url "is not meant to validate the given URL, it only breaks it up into the above listed parts." php.net 警告 parse_url“不是要验证给定的URL，它只会将其分解为上面列出的部分。” If that's acceptable, it appears to (more or less) work with non-Latin characters: 如果可以接受，那么它似乎（或多或少）适用于非拉丁字符：

~ visitor$ cat parse.php 
<?php
$parsed = parse_url( 'http://uk.wikipedia.org/wiki/Фотосинтез' );
print_r( $parsed );
?>

~ visitor$ php parse.php 
Array
(
    [scheme] => http
    [host] => uk.wikipedia.org
    [path] => /wiki/Фо?_о?_ин?_ез
)

验证非拉丁网址

问题描述

1 个解决方案

解决方案1
1 已采纳 2012-06-26 17:26:19

验证非拉丁网址

问题描述

1 个解决方案

解决方案1 1 已采纳 2012-06-26 17:26:19

解决方案1
1 已采纳 2012-06-26 17:26:19