4

我查看了mysql参考,在这里,在stackoverflow中,看起来很多人在字符编码方面遇到了困难,但我找不到这个问题的明确答案:

一个 java 程序正在使用 mysql 数据库,当查询中有特殊字符,如 ű,ő(但 á,é,í,ó,ú 有效)时,它会抛出 SQLException:

    Class.forName("sun.jdbc.odbc.JdbcOdbcDriver");
    Connection conn = DriverManager.getConnection(
            "jdbc:odbc:<database>", "<user>", "<pass>"
            );

    PreparedStatement stmt = conn.prepareStatement(
            " select username, priority " +
            " from users " +
            " where username like ?");
            //" where username like ? collate latin2_general_ci");
    stmt.setString(1, "Ernő");
    ResultSet rs = stmt.executeQuery();
    while(rs.next()) {
        System.out.println(rs.getString("username") + "  " + rs.getInt("priority"));
    }

例外:

Exception in thread "main" java.sql.SQLException:
[MySQL][ODBC 5.1 Driver][mysqld-5.1.63-0ubuntu0.10.04.1]
Illegal mix of collations (latin2_hungarian_ci,IMPLICIT)
and (latin1_swedish_ci,COERCIBLE) for operation 'like'

表结构为:

CREATE TABLE `users` (
`username` varchar(45) COLLATE latin2_hungarian_ci NOT NULL,
`password` varchar(45) COLLATE latin2_hungarian_ci NOT NULL,
`priority` tinyint(4) NOT NULL,
`idCimlistaFK` int(10) unsigned DEFAULT NULL,
`timestamp` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
PRIMARY KEY (`username`),
KEY `fk_users_tbl_Cimlista1` (`idCimlistaFK`),
CONSTRAINT `fk_users_tbl_Cimlista1` FOREIGN KEY (`idCimlistaFK`)
REFERENCES `tbl_cimlista` (`id_Cimlista`) ON DELETE NO ACTION ON UPDATE NO ACTION
) ENGINE=InnoDB DEFAULT CHARSET=latin2 COLLATE=latin2_hungarian_ci 

当我试图在注释行中强制进行排序时:

" where username like ? collate latin2_general_ci");

它还会引发异常:

COLLATION 'latin2_general_ci' is not valid for CHARACTER SET 'latin1'

有谁知道,如何解决这个问题(可能在java中)?(我不希望更改数据库,因为它是一个遗留系统。)

更新:

根据 Rahul Agrawal 的建议,我使用了以下网址:

"jdbc:mysql://localhost:3306/database?characterEncoding=latin2"

它确实有效,但是,我注意到了一个副作用。当我使用测试服务器更新和插入数据时,它在 Win XP 机器上运行 mysql,一切正常。但是当我更新数据并将数据插入到运行 Ubuntu 的生产服务器时,我确实得到了行,其中有 ?-符号而不是 ő,ű-字母。从那以后,我通过一种解决方法解决了这个问题,但是很高兴看到和理解,出了什么问题,这里有什么问题。

4

2 回答 2

8

您需要使用 UTF-8 字符集

在连接 URL 中试试这个

jdbc:mysql://localhost:3306/testdb?characterEncoding=utf8

数据库 CHARSET=utf8

数据库排序规则 = utf8_general_ci

于 2012-06-26T12:42:43.963 回答
0

由于显而易见的原因,您并不总是可以更改数据库列。在这些时候,正则表达式可以帮助您。

您可以使用以下内容:

String output = input.replaceAll("[^\\u0020-\\u007e\\u00a0-\\u00ff]",
                                     replaceWithWhateverYouWant);
于 2018-11-15T18:45:19.183 回答