[英]PHP: echo'ing UTF-8 characters into Windows command line
我遇到了一个问题,但不知道是 PHP 还是 Windows 的命令行。 当 PHP 脚本尝试在加载了 UTF-8 代码页的情况下将 UTF-8 字符回显到 cmd 时,该进程会意外停止。 这是一个案例:
测试1.php:
<?php
error_reporting( -1 );
echo 'АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЫЭЮЯ', "\n";
echo "OK";
?>
测试2.php:
<?php
error_reporting( -1 );
echo 'ASCII: ABCDEFGHIJKLMNOPQRSTUVWXYZ', "\n";
echo 'UTF-8: АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЫЭЮЯ', "\n";
echo 'UTF-8: АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЫЭЮЯ', "\n";
echo "OK";
?>
(test1.php 和 test2.php 都保存在没有 BOM 的 UTF-8 中。)
命令提示符日志:
e:\tests>chcp 1252
Active code page: 1252
e:\tests>php -f test1.php
АБВГДЕЁЖЗРЙКЛМНОПРСТУФХЦЧШЩЫРЮЯ
OK
e:\tests>php -f test2.php
ASCII: ABCDEFGHIJKLMNOPQRSTUVWXYZ
UTF-8: АБВГДЕЁЖЗРЙКЛМНОПРСТУФХЦЧШЩЫРЮЯ
UTF-8: АБВГДЕЁЖЗРЙКЛМНОПРСТУФХЦЧШЩЫРЮЯ
OK
e:\tests>chcp 65001
Active code page: 65001
e:\tests>php -f test1.php
e:\tests>php -f test2.php
ASCII: ABCDEFGHIJKLMNOPQRSTUVWXYZ
UTF-8: АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЫЭЮЯ
e:\tests>
在 1252 模式下,所有字符都会得到回显(当然,虽然不正确)。 但是在 65001 (UTF-8) 模式下,test1 停在第一个字符上,而 test2 停在第二个 UTF-8 行的第一个字符上。
PHP版本是:
PHP 5.4.13 (cli) (built: Mar 15 2013 02:07:14)
Copyright (c) 1997-2013 The PHP Group
Zend Engine v2.4.0, Copyright (c) 1998-2013 Zend Technologies
Windows 是 XP SP3。
更新:
1)如果我将echo
更改为:
$f = fopen( 'php://stdout', 'w' );
fwrite( $f, ... );
...
close( $f );
有用。
2)如果我重定向输出:
e:\tests>php -f test1.php > out.log
它也适用(使用echo
)。
但是第一种情况有什么问题呢?
对于 windows 西里尔文,这对我有帮助(windows 7 git bash 控制台):
$text = "Юра";
echo iconv("utf-8", "cp866", $text)
您还需要更改字体。
右键单击“命令提示符”的标题栏,单击“属性”并选择一种 TTF 字体而不是“光栅字体”。
试试这个。 我希望它会起作用:
shell_exec('chcp 866');
echo iconv('utf-8', 'cp866', $message);
或者使用这个改进的助手:
class ConsoleHelper
{
/**
* @var boolean
*/
private static $isEncodingSet = false;
/**
* @param string $message
* @return string
*/
public static function encodeMessage($message)
{
$isWindows = (DIRECTORY_SEPARATOR == '\\');
if ($isWindows) {
if ( ! self::$isEncodingSet) {
shell_exec('chcp 866');
self::$isEncodingSet = true;
}
$message = iconv('utf-8', 'cp866', $message);
}
return $message;
}
}
格里森的反应很棒!
建议:为echo
创建一个包装函数,只接收可以包含非 ASCII 字符的文本并正确显示它们。 就像是:
<?php
function eecho($texto){
echo iconv("utf-8", "cp850", $texto);
}
$texto = "Aviação!";
echo $texto;
echo PHP_EOL;
eecho($texto);
echo PHP_EOL;
然后你可以简单地替换echo "Your text ...";
by eecho ('Your text ...');
将您的 PHP 文件另存为 UTF-8(不带 BOM)。 要找出操作系统对第二个参数的正确值是什么,只需在命令提示符下键入chcp
,就会显示您的当前值。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.