0

我希望这次能收到我的答复

我写了下面的代码,但不知道我的错误在哪里,我认为它似乎是正确的

这段代码应该在 oracle xe 中插入超过一百万条记录,我是在一个一个执行 PreparedStatement 时通过单个插入语句编写的,但它运行了 6 个小时!!!!!!因为我被迫使用 thread.sleep()

    package tokenizing;
import java.sql.*;
import java.util.StringTokenizer;

public class TokenExtraction2 {


    public static void main(String[] args) throws Exception {
        String myText[]=new String[2276];
        Jdbc db=new Jdbc();
        String st1=null;
        int i=0;
        int j=0;
        String tokens[][]=new String [3000000][2];
        st1="select ntext from NEWSTEXT ";
        ResultSet result=db.select(st1);
        while(result.next())
        {
            myText[i]=result.getString("ntext");
            ++i;
        }
        db.closedb();
        i=0;
        StringBuilder st= new StringBuilder("insert into tokens5(token,tokenlength) values");
        while(i<2276)
        {

            StringTokenizer s=new StringTokenizer(myText[i]," 0123456789*./»«،~!@#$%^&()_-\"+=:;|<>?“؟”’{}[]‘,\\\t\n\r\fabcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ...—`—ـ؛–…_");
            while(s.hasMoreTokens()){
                String key=s.nextToken();
                tokens[j][0]=key;
                tokens[j][1]=(key.length())+"";
                st.append("(?,?)");
                if( i<2276 && s.hasMoreTokens())
                st.append(", ");
                else
                st.append(";");
                //db.insert(st, key, key.length());
                //db.closedb();
                System.out.println(key+"\t");



                   j++;
            }
            System.out.println("num of news is: "+i);
            System.out.println("*****************************************************************************************");
            System.out.println("num of tokens is: "+j);
            System.out.println("next news"+"\t");
            //j=0;

            i++;
        }

        System.out.println(st);
        int k=0;

         Class.forName("oracle.jdbc.driver.OracleDriver") ;
        Connection  con = DriverManager.getConnection("jdbc:oracle:thin:@localhost:1521:xe","ALBALOO","myjava123");
        PreparedStatement ps=con.prepareStatement(st.toString());
    //  con.setAutoCommit(false);
        //j=1;
        i=0;
        //j=j-286;
        while(k<j)
        {

            i=i+1;

                ps.setString(i, tokens[k][0]);

            System.out.println(i);
                i=i+1;
                ps.setInt(i,Integer.parseInt(tokens[k][1]));

                System.out.println(k+2);

                k++;


        }

        ps.executeUpdate();
    //con.commit();
}









}
4

2 回答 2

1

您似乎试图insert通过传递多组值来使用单个语句插入多行;st似乎最终为:

insert into tokens5(token,tokenlength) values (?,?), (?,?);(?,?), ...;`

具有数千个值对占位符。您不能像这样传递多组值。Oracle 不希望在第一个 逗号之后出现逗号(?,?),因此会出现 ORA-00933 错误。您还有多个分号,因为您每次都在iwhile 循环周围放置一个分号。正如 Mark Rotteveel 指出的那样,您不应该有任何语句,因为 Oracle JDBC 不允许多个语句。

您最好将字符串标记器实现为数据库上的函数,然后执行单个insert ... select from newstext,而不是将所有数据拉出、转换并推回。不过,您至少应该批量更新。例如,您可以将tokens作为数组参数传递给存储过程。

我很难理解你真正在做什么,因为看起来你几乎在任何字符上分割一个字符串,这并没有给实际的键留下太多,不是吗?虽然很难追...

于 2013-07-23T19:01:52.500 回答
1

如果您查看 SQL 语言参考中的 Oracle INSERT 描述,那么您可以看到 Oracle 不支持使用VALUES. 同样正如我在上面评论的那样,;在查询中使用并不总是有效,因为它通常不是查询本身的一部分,而是命令行或脚本输入的终止符。

在您的特定情况下,您甚至试图将多个语句放入一个准备中。在 JDBC 中,单个语句准备(或执行)应该只是一个实际语句,而不是由 . 分隔的多个语句;。驱动程序(或数据库)通常不允许这样做,尽管有些提供了执行多条语句的选项,但这不符合 JDBC。

相反,您可以使用 JDBC 批量更新:

con.setAutoCommit(false);
try (
    PreparedStatement pstmt = con.
         prepareStatement("insert into tokens5(token,tokenlength) values (?, ?)"
) {
    // I use tokens as an abstraction on how you get the token and its length
    while (tokens.next()) {
        pstmt.setString(1, tokens.token());
        pstmt.setInt(2, tokens.length());
        pstmt.addBatch();
    };
    pstmt.executeBatch();
    // Optionally do something with result of executeBatch()
    con.commit();
}

根据数据库+驱动程序,这将具有与多值插入类似的运行时性能(我相信 Oracle 确实如此),或者只是表现得好像您使用不同的值多次执行单个 PreparedStatement。

于 2013-07-23T19:24:12.597 回答