1

我用 Java 编写了一个程序,使用 aScanner从每行中获取由空格分隔的两个元素,以将其放入存储在ArrayList. 它工作得很好,但是当涉及到 10000 行的输入时,它会变得很长。我阅读了一些主题和网站(例如this),告诉BufferedReader我会比Scanner但我在尝试时没有看到任何改进。

以下是我迄今为止用来解析输入的每一行的行:

  String charsetName = "UTF-8";
  Scanner scanner = new Scanner(new BufferedInputStream(System.in), charsetName);

然后我在调用的行数期间运行了一个循环:

 String[] mid = scanner.nextLine().split(" ");

所以我试图用以下方式替换Scanner

BufferedReader reader = new BufferedReader(new InputStreamReader(System.in));
String[] base = reader.readLine().split(" ");

它没有改变任何东西(两种情况下 12000 行 8 秒)

我是否朝着正确的方向前进以使程序更快地运行?还是问题来自使用循环遍历每一行?

4

1 回答 1

2

我使用以下代码读取了一个280,000 行的文件(每行由两个单词组成,用空格分隔)并将它们拆分为一个空格。花了 0.105 秒。所以我想更多地了解你正在解析的行以及你正在用它做什么。请粘贴更多代码。

  public static void main(String args[]) throws Exception {

    Date start = new Date();

    BufferedReader b = new BufferedReader(new FileReader("aa.txt"));
    String line;
    while ((line = b.readLine())!=null) {
      String[] splat = line.split(" ");
    }
    b.close();

    Date end = new Date();
    System.out.println("Took " + (end.getTime() - start.getTime()) / 1000.0 + " seconds");
  }

我修改了上面的代码,将每个 splat 数组添加到数组列表中(不确定你为什么要这样做,但我猜这就是你想要做的,从你的 OP)。代码减慢到 0.244 秒。仍然不到一秒钟。请提供更多信息。

补充 - 完整代码(编译javac Julien.java)。请记住将 aa.txt 替换为您的文件名。

import java.util.*;
import java.io.*;

public class Julien {

  public static void main(String args[]) throws Exception {

    Date start = new Date();
//    List arrl = new ArrayList();
    BufferedReader b = new BufferedReader(new FileReader("aa.txt"));
    String line;
    while ((line = b.readLine())!=null) {
      String[] splat = line.split(" ");
//      arrl.add(splat);
    }
    b.close();
    Date end = new Date();
    System.out.println("Took " + (end.getTime() - start.getTime()) / 1000.0 + " seconds");
  }
}
于 2013-01-16T01:42:40.147 回答