9

我们正在尝试将 UTF-16 编码的字符串存储到 AL32UTF8 Oracle 数据库中。

我们的程序在WE8MSWIN1252用作字符集的数据库上完美运行。当我们尝试在使用AL32UTF8它的数据库上运行它时,会得到一个java.sql.SQLException: ORA-01461: can bind a LONG value only for insert into a LONG column.

在下面的测试用例中,只要我们的输入数据不会太长,一切都可以正常工作。

输入字符串可以超过 4000 个字符。我们希望尽可能多地保留信息,即使我们意识到必须切断输入。

我们的数据库表是使用CHAR关键字定义的(见下文)。我们希望这将允许我们存储多达 4000 个字符集的任何字符集。这可以做到吗?如果是这样,怎么做?

我们尝试将字符串转换为UTF8使用 aByteBuffer没有成功。OraclePreparedStatement.setFormOfUse(...)也没有帮助我们。

切换到 aCLOB不是一种选择。如果绳子太长,则需要剪断。

这是我们目前的代码:

public static void main(String[] args) throws Exception {
    String ip ="193.53.40.229";
    int port = 1521;
    String sid = "ora11";
    String username = "obasi";
    String password = "********";

    String driver = "oracle.jdbc.driver.OracleDriver";
    String url = "jdbc:oracle:thin:@" + ip + ":" + port + ":" + sid;
    Class.forName(driver);

    String shortData = "";
    String longData = "";
    String data;

    for (int i = 0; i < 5; i++)
        shortData += "é";

    for (int i = 0; i < 4000; i++)
        longData += "é";

    Connection conn = DriverManager.getConnection(url, username, password);

    PreparedStatement stat = null;
    try  {
        stat = conn.prepareStatement("insert into test_table_short values (?)");
        data = shortData.substring(0, Math.min(5, shortData.length()));
        stat.setString(1, data);
        stat.execute();

        stat = conn.prepareStatement("insert into test_table_long values (?)");
        data = longData.substring(0, Math.min(4000, longData.length()));
        stat.setString(1, data);
        stat.execute();
    } finally {
        try {
            stat.close();
        } catch (Exception ex){}
    }
}

这是简单表的创建脚本:

CREATE TABLE test_table_short (
    DATA    VARCHAR2(5 CHAR);
);

CREATE TABLE test_table_long (
    DATA    VARCHAR2(4000 CHAR);
);

测试用例在短数据上完美运行。然而,在长数据上,它不断收到错误。即使我们longData只有 3000 个字符长,它仍然不能成功执行。

提前致谢!

4

2 回答 2

10

在 Oracle 12.1 之前,一个VARCHAR2列被限制为在数据库字符集中存储 4000 字节的数据,即使它被声明为VARCHAR2(4000 CHAR). 由于字符串中的每个字符都需要 UTF-8 字符集中的 2 个字节的存储空间,因此您将无法在列中存储超过 2000 个字符。当然,如果您的某些字符实际上只需要 1 个字节的存储空间,或者其中一些字符需要超过 2 个字节的存储空间,那么这个数字将会改变。当数据库字符集是 Windows-1252 时,字符串中的每个字符只需要一个字节的存储空间,因此您可以在列中存储 4000 个字符。

由于您有更长的字符串,是否可以将列声明为 aCLOB而不是 a VARCHAR2?这将(有效地)消除长度限制(a 的大小有一个限制,CLOB这取决于 Oracle 版本和块大小,但它至少在多个 GB 范围内)。

如果您碰巧使用的是 Oracle 12.1 或更高版本,该max_string_size参数允许您将列的最大大小VARCHAR2从 4000 字节增加到 32767 字节

于 2012-07-19T14:32:20.087 回答
4

通过将字符串切割为所需的字节长度解决了这个问题。请注意,这不能通过简单地使用来完成

stat.substring(0, length)

因为这会产生一个 UTF-8 字符串,它可能比允许的长度长三倍。

while (stat.getBytes("UTF8").length > length) {
  stat = stat.substring(0, stat.length()-1);
}

注意不要使用 stat.getBytes() 因为这取决于设置的 'file.encoding' 并产生 Windows-1252 或 UTF-8 字节!

如果你使用 Hibernate,你可以使用 org.hibernate.Interceptor 来做到这一点!

于 2013-03-15T10:02:32.233 回答