繁体   English   中英

带有混乱编码的$ _GET变量

[英]$_GET variable with messed up encoding

我在我的网站上编码很麻烦。

这是我现在的问题,如果我去analize.php?dialog=árbol ,代码是:

<?
echo $_GET['dialog'];
echo "sabía";

我得到:

sabía
sabía

我正在使用ANSI,改为UTF-8打破两者。 我不明白为什么会发生这种情况,而且上面没有任何代码。 我不关心它们如何显示,因为该文件仅用于从我的数据库中获取数据。 但是我需要正确地显示$_GET ,这样我就可以将它包含在查询中。

如何才能做到这一点?

您不能在URL中发送字符“í”,URL必须使用ASCII字符集的子集。 因此,在发送到服务器之前,URL会被浏览器编码为?dialog=sab%C3%ADa %C3%AD表示两个字节C3 AD ,它是字符“í”的UTF-8编码。 你可以用var_dump($_SERVER['QUERY_STRING']);确认这个var_dump($_SERVER['QUERY_STRING']); 这由PHP自动解码,结果是“sabía”的UTF-8字节序列,其中“í”使用两个字节C3 AD进行编码。

您的浏览器使用Windows-1252或ISO-8859-1字符集解释此字节序列。 字节C3在此编码中表示“Ô,字节AD表示软连字符并且是不可见的。

两种可能的解决方

  1. 到处使用UTF-8(推荐!)

    • 将源代码保存为UTF-8
    • 输出一个标题,强制浏览器将网站解释为UTF-8:

       header('Content-Type: text/html; charset=utf-8'); 
  2. 使用mb_convert_encodingiconv$_GET值转换为Windows-1252 / ISO-8859-1(或您要在站点上使用的任何编码)(不推荐)

    • 即使在这种情况下,您也应该设置一个标题,向浏览器宣告您正在使用的编码

简而言之,您需要确保在任何地方使用相同的编码,并向浏览器指定具体的编码。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM