繁体 English 中英

卷曲：从具有错误字符集的站点获取UTF-8数据

[英]Curl: get UTF-8 data from site with incorrect charset

原文 2012-02-25 20:05:49 9 1 php/ curl/ character-encoding

我抓了一些偶尔在标题中有UTF-8字符的网站，但没有指定UTF-8作为字符集（qq.com就是一个例子）。 当我在浏览器中查看网站时，我要复制的数据（即标题）看起来是正确的（日文或中文......不太确定）。 我可以复制标题并将其粘贴到终端中，它看起来完全一样。 我甚至可以将它写入数据库，当我从数据库中检索它时，它看起来仍然相同，并且正确。

但是，当我使用cURL时，打印的数据是错误的。 我可以从命令行运行cURL或者使用PHP ..当它打印到终端时显然是不正确的，当我将它存储到数据库时它仍然是这样（请记住：终端可以正确显示这些字符）。 我已经尝试了以下所有符合条件的组合：

将CURLOPT_BINARYTRANSFER为true
mb_convert_encoding($html, 'UTF-8')
utf8_encode($html)
utf8_decode($html)

这些都不会按预期显示字符。 这非常令人沮丧，因为只要访问该网站我就能轻松获得正确的角色，但是cURL不能。 我已经阅读了很多建议，比如这个：如何使用不同CHARSET的网站在PHP中使用CURL获取网页标题？

一般来说，解决方案似乎是“将数据转换为UTF-8”。 说实话，我实际上并不知道这意味着什么。 上述功能不能将数据转换为UTF-8吗？ 为什么不是UTF-8？ 它是什么，为什么它在某些情况下会正常显示，而不是cURL？

1 个解决方案

你有没有尝试过：

$html = iconv("gb2312","utf-8",$html);

gb2312取自qq.com标题

PHP Curl UTF-8 字符集

[英]PHP Curl UTF-8 Charset

从网站获取html字符集-NON UTF-8格式的元标记

[英]Get the html charset from a site - Meta tags in a NON UTF-8 format

迁移数据，从latin1 charset迁移到UTF-8

[英]Migrating data, from latin1 charset to UTF-8

如何使用内容类型从 webhook 获取数据：application/x-www-form-urlencoded;charset=UTF-8？

[英]How to get data from webhook with content-type: application/x-www-form-urlencoded;charset=UTF-8?

UTF-8 从 MySQL 到 PHP 的字符集问题

[英]UTF-8 charset issues from MySQL in PHP

在php / mysql网站中增加charset =“ utf-8”字体大小

[英]Increase charset=“utf-8” Font size in php/mysql site

CodeIgniter 字符集为 UTF-8

[英]CodeIgniter charset to UTF-8

歌剧字符集UTF-8

[英]Opera charset UTF-8

如何在php中使用utf-8字符集编码从base64解码数据

[英]How to decode data from base64 with utf-8 charset encoding in php

使用 PHP FreeTDS 扩展从 MSSQL 服务器获取带有 UTF-8 字符集的数据

[英]Getting data with UTF-8 charset from MSSQL server using PHP FreeTDS extension

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 PHP Curl UTF-8 字符集从网站获取html字符集-NON UTF-8格式的元标记迁移数据，从latin1 charset迁移到UTF-8 如何使用内容类型从 webhook 获取数据：application/x-www-form-urlencoded;charset=UTF-8？ UTF-8 从 MySQL 到 PHP 的字符集问题在php / mysql网站中增加charset =“ utf-8”字体大小 CodeIgniter 字符集为 UTF-8 歌剧字符集UTF-8 如何在php中使用utf-8字符集编码从base64解码数据使用 PHP FreeTDS 扩展从 MSSQL 服务器获取带有 UTF-8 字符集的数据

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM