繁体   English   中英

PHP xml到html编码的问题

[英]PHP xml to html encoding issue

我正在从rss xml抓取rss feed数据。 一些字符串中有引号。 在将字符串粘贴到数据库之前,我正在通过htmlentities()运行字符串。 然后,当我尝试在浏览器中显示相同的信息时,引号显示为“â??”。 该字符在数据库中存储为“&circs”(无空格)

我页面的标题

<!DOCTYPE HTML>
<html>
<head>
    <meta charset="utf-8">

我确定其他实体显示不正确。 我应该如何纠正呢?

带有“ Agawi”引号的示例供稿: http ://feeds.feedburner.com/TechCrunch/gaming

如果您使用PHP,则此例程可能会很有用。

它将标准的M $ Word替换为键入文本的字符代码添加到标准的get_html_translation_table()中。
否则,这些字符将永远无法在html输出中正确显示,这是您的麻烦。

function get_html_translation_table_CP1252() {
    $trans = get_html_translation_table(HTML_ENTITIES);
    $trans[chr(130)] = '&sbquo;';    // Single Low-9 Quotation Mark
    $trans[chr(131)] = '&fnof;';    // Latin Small Letter F With Hook
    $trans[chr(132)] = '&bdquo;';    // Double Low-9 Quotation Mark
    $trans[chr(133)] = '&hellip;';    // Horizontal Ellipsis
    $trans[chr(134)] = '&dagger;';    // Dagger
    $trans[chr(135)] = '&Dagger;';    // Double Dagger
    $trans[chr(136)] = '&circ;';    // Modifier Letter Circumflex Accent
    $trans[chr(137)] = '&permil;';    // Per Mille Sign
    $trans[chr(138)] = '&Scaron;';    // Latin Capital Letter S With Caron
    $trans[chr(139)] = '&lsaquo;';    // Single Left-Pointing Angle Quotation Mark
    $trans[chr(140)] = '&OElig;    ';    // Latin Capital Ligature OE
    $trans[chr(145)] = '&lsquo;';    // Left Single Quotation Mark
    $trans[chr(146)] = '&rsquo;';    // Right Single Quotation Mark
    $trans[chr(147)] = '&ldquo;';    // Left Double Quotation Mark
    $trans[chr(148)] = '&rdquo;';    // Right Double Quotation Mark
    $trans[chr(149)] = '&bull;';    // Bullet
    $trans[chr(150)] = '&ndash;';    // En Dash
    $trans[chr(151)] = '&mdash;';    // Em Dash
    $trans[chr(152)] = '&tilde;';    // Small Tilde
    $trans[chr(153)] = '&trade;';    // Trade Mark Sign
    $trans[chr(154)] = '&scaron;';    // Latin Small Letter S With Caron
    $trans[chr(155)] = '&rsaquo;';    // Single Right-Pointing Angle Quotation Mark
    $trans[chr(156)] = '&oelig;';    // Latin Small Ligature OE
    $trans[chr(159)] = '&Yuml;';    // Latin Capital Letter Y With Diaeresis
    ksort($trans);
    return $trans;
}

$trans = get_html_translation_table_CP1252();
$feed = strtr($feed, $trans);

是的,因为它们不是常规引号 ,更像Microsoft Word引号。 您应该以feedburner的示例为例,并将其转换&ldquo; &rdquo; 手动。

例如

$feed = str_replace('“', '&ldquo;', $feed);
$feed = str_replace('”', '&rdquo;', $feed);

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM