3

我正在使用 Buffered Reader 将文件的各个行传递给 Java 的StringTokenizer. 该文件的结构如下:

"2,0";"12345";"foo";"foo.doc"
"2,4";"23456";"foo";"foo.doc";"34567";"foo7";"foo7.doc";"45678";"foo6";"foo6.doc";"56789";"foo5";"foo5.doc";"67890";"foo4";"foo4.doc"   
"3,0";"34567";"foo7";"foo7.doc"
"3,0";"45678";"foo6";"foo6.doc"
"3,0";"56789";"foo5";"foo5.doc"
"3,0";"67890";"foo4";"foo4.doc"

这是我正在使用的代码——到目前为止。

public class parse {
  public static void main(String args[]) {
    FileInputStream inputStream = new FileInputStream("whidata0.txt");
    BufferedReader br = new BufferedReader(new InputStreamReader(inputStream)); 
    while((scrubbedInput=br.readLine())!=null) {
      StringTokenizer strTok = new StringTokenizer(scrubbedInput, ";", false);
      int tokens = strTok.countTokens();
      while (strTok.hasMoreTokens()) {
        tok01 = strTok.nextToken();
      }
      System.out.println("  scrubbed: " + scrubbedInput);
      System.out.println("    tokens: " + tokens);
      System.out.println("     tok01: " + tok01);
    }
  }
}

我需要能够将字符串中的每个标记分配给变量以进行额外的操作。但是,如果我在while循环中分配这些变量,迭代将覆盖我的变量,并且它们都将返回相同的值。

我正在尝试设计一种方法来执行以下操作:

String token01 = strTok.tokenNumber(0);
String token02 = strTok.tokenNumber(1);
String token03 = strTok.tokenNumber(2);
String token04 = strTok.tokenNumber(3);
etc.

但在 String Tokenizer 文档中找不到任何允许这样做的方法。我当然可以将每一行写入一个 String 数组thisLineOfTokens[]并使用 for 循环来创建String tokenN = thisLineOfTokens[n],但是有没有更直接的方法来访问特定的令牌?

我有点迷失从我的字符串中引用特定令牌的最佳方法。

4

2 回答 2

4

您可以使用String.split 它而不是StringTokenizer.

String[] split = scrubbedInput.split(";");

split[2]; //index=2
于 2013-10-04T14:53:04.863 回答
0

来自这里的信息:

建议任何寻求此功能的人改用 String 的split方法或 java.util.regex 包。

所以,你可以使用这样的东西:

String testLine = "your;test;data;"

String[] result = testLine.split(";");
for (int x=0; x<result.length; x++){
    System.out.println(result[x]);
}

输出:

your
test
data
于 2017-04-14T13:06:57.537 回答