java - 使用Java中的Scanner在一行中匹配令牌的问题

Question

我需要匹配输入文本行中的某些内容。这些行看起来像这样：

 to be/ Σ _ Σ  [1pos, 1neg] {0=1, 2=1}

我正在使用 Scanner 类来读取文本的每一行，并且我编写了以下代码。但是，有些东西不能正常工作，因为模式“to”与该行不匹配，它应该是，因为“to”包含在该行中（我试图不仅匹配该行中的“to”，但没有匹配项）：

 Scanner scanner = new Scanner(file);
 while(scanner.hasNext()) {
      String line = scanner.nextLine();
      System.out.println("line: " + line);
      Pattern p_pos = Pattern.compile("to");
      Matcher m_pos = p_pos.matcher(line);
      String match = m_pos.group(0);
      System.out.println("match: " + match);
      boolean b_pos = m_pos.matches();
      if(b_pos) {
          System.out.println(match);
      }
 }

输出：

line:    to be/ Σ _ Σ  [1pos, 1neg] {0=1, 2=1}
Exception in thread "main" java.lang.IllegalStateException: No match found
    at java.util.regex.Matcher.group(Matcher.java:485)
    at lady.PhrasesFromFile.readFile(PhrasesFromFile.java:31)
    at lady.PhrasesFromFile.main(PhrasesFromFile.java:17)

我还有一个问题：如何处理该行，以便存储从行首到第一个“/”符号的所有内容？我在 API 中找不到任何方法。有可能这样做吗？我基本上想连续遍历该行，将行的各个部分存储在不同的变量中，然后使用这些变量的值。由于我不知道在第一个“/”符号之前有多少个标记，因此我无法使用 next() 一定次数。

先感谢您。

score 1 · Accepted Answer

.matches()尝试匹配整个输入字符串。如果.find()要匹配输入字符串的一部分，或者.lookingAt()要匹配输入字符串的开头，请使用。

http://java.sun.com/j2se/1.4.2/docs/api/java/util/regex/Matcher.html

此外，如果您扩展您的模式以包含匹配组（有关匹配组如何工作的更多详细信息，请参阅通用正则表达式参考），您可以.group()在成功匹配后使用该函数来检索与模式中特定组匹配的子字符串。

score 1 · Accepted Answer

您可以使用以下方法提取令牌所需的部分：

String tokenSection = Pattern.compile("(to\\s+.*?)/").matcher(line).find().group(1);

然后循环使用以提取令牌

Pattern.compile("\\w+").matcher(tokenSection).find();

显然，您不会直接插入上述代码。

java - 使用Java中的Scanner在一行中匹配令牌的问题

2 回答 2

Related

Reference