0

我正在从 rss xml 抓取 rss 提要数据。一些字符串中有引号。在将字符串插入数据库之前,我正在通过 htmlentities() 运行字符串。然后,当我尝试在浏览器中显示相同的信息时,引号显示为“??”。字符在数据库中存储为“& acirc; ??s”(无空格)

我的页面的标题

<!DOCTYPE HTML>
<html>
<head>
    <meta charset="utf-8">

我确定其他实体显示不正确。我应该如何去纠正这个?

带有“Agawi”引号的示例提要:http: //feeds.feedburner.com/TechCrunch/gaming

4

2 回答 2

1

如果您使用 PHP,此例程可能会很有用。

它在标准 get_html_translation_table() 中添加了通常 M$ Word 替换为键入文本的字符代码。
否则,这些字符将永远不会在 html 输出中正确显示,这是您的麻烦。

function get_html_translation_table_CP1252() {
    $trans = get_html_translation_table(HTML_ENTITIES);
    $trans[chr(130)] = '&sbquo;';    // Single Low-9 Quotation Mark
    $trans[chr(131)] = '&fnof;';    // Latin Small Letter F With Hook
    $trans[chr(132)] = '&bdquo;';    // Double Low-9 Quotation Mark
    $trans[chr(133)] = '&hellip;';    // Horizontal Ellipsis
    $trans[chr(134)] = '&dagger;';    // Dagger
    $trans[chr(135)] = '&Dagger;';    // Double Dagger
    $trans[chr(136)] = '&circ;';    // Modifier Letter Circumflex Accent
    $trans[chr(137)] = '&permil;';    // Per Mille Sign
    $trans[chr(138)] = '&Scaron;';    // Latin Capital Letter S With Caron
    $trans[chr(139)] = '&lsaquo;';    // Single Left-Pointing Angle Quotation Mark
    $trans[chr(140)] = '&OElig;    ';    // Latin Capital Ligature OE
    $trans[chr(145)] = '&lsquo;';    // Left Single Quotation Mark
    $trans[chr(146)] = '&rsquo;';    // Right Single Quotation Mark
    $trans[chr(147)] = '&ldquo;';    // Left Double Quotation Mark
    $trans[chr(148)] = '&rdquo;';    // Right Double Quotation Mark
    $trans[chr(149)] = '&bull;';    // Bullet
    $trans[chr(150)] = '&ndash;';    // En Dash
    $trans[chr(151)] = '&mdash;';    // Em Dash
    $trans[chr(152)] = '&tilde;';    // Small Tilde
    $trans[chr(153)] = '&trade;';    // Trade Mark Sign
    $trans[chr(154)] = '&scaron;';    // Latin Small Letter S With Caron
    $trans[chr(155)] = '&rsaquo;';    // Single Right-Pointing Angle Quotation Mark
    $trans[chr(156)] = '&oelig;';    // Latin Small Ligature OE
    $trans[chr(159)] = '&Yuml;';    // Latin Capital Letter Y With Diaeresis
    ksort($trans);
    return $trans;
}

$trans = get_html_translation_table_CP1252();
$feed = strtr($feed, $trans);
于 2013-11-01T01:01:24.537 回答
0
于 2012-08-25T23:43:33.150 回答