繁体 English 中英

字符集检测，元与标题

[英]charset detection, meta vs header

原文 2014-05-29 10:31:14 2 1 php/ html/ utf-8/ character-encoding/ http-headers

我们最近在尝试确定用于页面的正确编码时遇到了一些麻烦。 我们遇到了具有以下设置的页面：

标头响应：

Content-Type:text/html; charset=GBK

元标记：

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

实际内容以GBK为单位，现代浏览器足够聪明，可以为此页面使用正确的编码。

但是对于爬虫（使用curl），我们不得不决定选择一个字符集值而不是另一个。 所以我的问题是： 将标头字符集替换为元字符集是正常的事情吗？

（我们尝试过的大多数基于内容的编码检测算法充其量都是不稳定的，只要一个字符集比另一个字符集更可靠，相对于我们自己的编码检测中的任何一种，我们更喜欢使用指定的字符集。）

将标头字符集替换为元字符集是正常的事情吗？

是。 请参阅规格。

在第4步检查HTTP标头。直到第5步（如果它在文件中显示得足够快）或第9步（否则），才检查Meta。

[英]Charset detection in PHP

[英]Facebook charset detection mechanism?

[英]Pound sign is displayed as '｣' symbol in sent email, have header meta tag as charset=utf-8

[英]Charset problem, MySQL and get_meta_tags()

[英]<meta charset='ISO-8859-9'> is not working properly

[英]Apache ignores meta charset on HTML display in browser

[英]Don't set charset in header

[英]php sends charset header but there is no header command

[英]header location and meta tags

[英]ext/mysql charset support vs ext/mysqli charset

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 PHP中的Charset检测 Facebook字符集检测机制？已发送邮件中的井号显示为“”，标题元标记为 charset=utf-8 字符集问题，MySQL和get_meta_tags（） <meta charset='ISO-8859-9'>工作不正常 Apache忽略浏览器中HTML显示的元字符集不要在标题中设置字符集 php发送charset标头，但没有标头命令标头位置和元标记 ext/mysql 字符集支持 vs ext/mysqli 字符集

相关标签