5

我在使用 PHP 编码时遇到问题。

我有一个使用 $.post 与我的 PHP 脚本交互的 JavaScript/jQuery HTML5 页面。然而,PHP 面临一个奇怪的问题,可能与编码有关。

当我写

htmlentities("í")

我希望 PHP 输出í. 但是,相反,它输出í 一开始,我认为我在编码方面犯了一些错误,但是

htmlentities("í")=="í"?"Good":"Fail";

正在输出“失败”,其中

htmlentities("í")=="í"?"Good":"Fail";

htmlentities($search, null, "utf-8")按预期工作。

我想让 PHP 与 MySQL 服务器通信,但它也有编码问题,即使我使用 utf8_encode。我应该怎么办?

编辑:在 SQL 命令上,写

SELECT id,uid,type,value FROM users,profile
WHERE uid=id AND type='name' AND value='XXX';

其中 XXX 不包含 í 字符,按预期工作,但如果有任何 'í' 字符,则不会。

SET NAMES 'utf8';
SET CHARACTER SET 'utf8';
SELECT id,uid,type,value FROM users,profile
WHERE uid=id AND type='name' AND value='XXX';

不仅 í 字符失败,而且没有任何“特殊”字符的字符串也失败。从 SET NAMES 和 SET CHARACTER SET 中删除 ' 字符似乎没有任何改变。

我正在使用 PDO 连接到 MySQL 数据库。

编辑 2:我正在使用 MySQL 版本 5.1.30 的 XAMPP for Linux。

编辑 3:SHOW VARIABLES LIKE '%character%'从 PhpMyAdmin 输出运行

character_set_client    utf8
character_set_connection    utf8
character_set_database  latin1
character_set_filesystem    binary
character_set_results   utf8
character_set_server    latin1
character_set_system    utf8
character_sets_dir  /opt/lampp/share/mysql/charsets/

从我的 PHP 脚本(使用 print_r)运行相同的查询输出:

Array
(
    [0] => Array
        (
            [Variable_name] => character_set_client
            [0] => character_set_client
            [Value] => latin1
            [1] => latin1
        )

    [1] => Array
        (
            [Variable_name] => character_set_connection
            [0] => character_set_connection
            [Value] => latin1
            [1] => latin1
        )

    [2] => Array
        (
            [Variable_name] => character_set_database
            [0] => character_set_database
            [Value] => latin1
            [1] => latin1
        )

    [3] => Array
        (
            [Variable_name] => character_set_filesystem
            [0] => character_set_filesystem
            [Value] => binary
            [1] => binary
        )

    [4] => Array
        (
            [Variable_name] => character_set_results
            [0] => character_set_results
            [Value] => latin1
            [1] => latin1
        )

    [5] => Array
        (
            [Variable_name] => character_set_server
            [0] => character_set_server
            [Value] => latin1
            [1] => latin1
        )

    [6] => Array
        (
            [Variable_name] => character_set_system
            [0] => character_set_system
            [Value] => utf8
            [1] => utf8
        )

    [7] => Array
        (
            [Variable_name] => character_sets_dir
            [0] => character_sets_dir
            [Value] => /opt/lampp/share/mysql/charsets/
            [1] => /opt/lampp/share/mysql/charsets/
        )

)

跑步

SET NAMES 'utf8';
SET CHARACTER SET 'utf8';
SHOW VARIABLES LIKE '%character%'

输出一个空数组。

4

3 回答 3

18

指定htmlentities的编码以匹配输入的编码非常重要,正如您在最后一个示例中所做的那样,但在前三个示例中省略了。

htmlentities($text,ENT_COMPAT,'utf-8');

关于与 MySQL 的通信,您需要确保连接排序规则和字符集与您正在传输的数据相匹配。您可以在配置文件中设置它,也可以在运行时使用以下查询:

SET NAMES utf8;
SET CHARACTER SET utf8;

确保表、数据库和服务器字符集也匹配。有一个设置是您无法在运行时更改的,那就是服务器的字符集。需要在配置文件中修改:

[mysqld]
character-set-server = utf8
default-character-set = utf8 
skip-character-set-client-handshake

阅读手册中有关 MySQL 中字符集和排序规则的更多信息。

于 2009-01-01T23:41:56.497 回答
7

晚复兴。但为了进一步参考,这里有一些额外的提示:

  1. 使用mysql_set_charset而不是SET xxx
  2. 确保使用 UTF-8 编码保存文件(这通常被忽略)
  3. 设置标题:
    <?php header("Content-type: text/html; charset=utf-8"); ?>

    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

  4. 如果您的 Apache 服务器配置包含具有不同编码的AddDefaultCharset指令,请向您的主机管理员大喊大叫。
于 2011-08-23T17:13:50.803 回答
1

我刚遇到这个问题。我有整个网站的西班牙语内容,包括所有你能想到的特殊字符 (áéíóúñ) 及其大写字母版本。

就我而言,这与服务器字符集/排序规则不一致。其他所有内容都设置为 utf8,但服务器字符集具有 latin1。这导致在数据库中输入的所有 utf8 数据都以原始编码形式显示,例如 L í 将等于带有波浪号的 A ...

我正在使用 mysqli,为了修复它,我使用了 Anthony Accioly 上面解释的方法(使用 mysql_set_charset)。所述方法有一个mysqli版本,这就是我使用的。

在那之后,我很困惑。查看我的网站时,我仍然一团糟。当然,我不知道通过将 latin1 更改为 utf8 我也会弄乱整个字符的编码/解码。所以我使用在线字符串编码器/解码器的帮助来修复我的表数据。

我对所有内容数据进行了各种导出(您可以将它们设置为获取更新查询,这对于您的更新过程来说会更快)并通过上述在线编码器/解码器运行 sql 输出,然后复制粘贴固定查询phpmyadmin sql 面板...从而修复了我的编码错误。现在一切都应该是这样,并且我能够再次处理有损搜索:Maria、maria、maria、maria 都将匹配 maría、maria、Maria 等。所有锐音字符都评估为它们的基本元音字符。大胜。

于 2012-12-13T20:25:00.173 回答