1

我正在尝试做 100 个大型列表项目之一。其中一个是关于一个测验制作者,它解析一个测验问题的文件,随机挑选其中一些,创建一个测验并对测验进行评分。

我正在尝试简单地加载测验问题并单独解析它们(即1个问题及其作为一个实体的多项选择答案)。

测验的格式如下:

Intro to Computer Science


    1. Which of the following accesses a variable in structure b?
    A. b->var
    B. b.var
    C. b-var
    D. b>var

    2. Which of the following accesses a variable in a pointer to a structure, *b?
    A. b->var
    B. b.var
    C. b-var
    D. b>var

    3. Which of the following is a properly defined struct?
    A. struct {int a;}
    B. struct a_struct {int a;}
    C. struct a_struct int a
    D. struct a_struct {int a;}

    4. Which properly declares a variable of struct foo?
    A. struct foo
    B. foo var
    C. foo
    D. int foo

当然有很多这样的问题,但它们都采用相同的格式。现在我使用 BufferedReader 将这些问题加载到一个字符串中,并尝试使用正则表达式来解析它们。但我无法在任何特定部分进行匹配。下面是我的代码:

    package myPackage;
    import java.io.*;
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;

public class QuizMaker {

    public static void main(String args[])
    {


        String file = "myfile/QuizQuestions.txt";
        StringBuilder quizLine = new StringBuilder();
        String line = null;

        try {
            FileReader reader = new FileReader(file);

            BufferedReader buffreader = new BufferedReader(reader);



            while ((line = buffreader.readLine()) != null)
            {
                quizLine.append(line);
                quizLine.append("\n");
            }

            buffreader.close();

        } catch (FileNotFoundException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
          catch (IOException e1) {

              e1.printStackTrace();
        }


        System.out.println(quizLine.toString());


        Pattern pattern = Pattern.compile("^[0-9]{1}.+\\?");
        Matcher matcher = pattern.matcher(quizLine.toString());

        boolean didmatch = matcher.lookingAt();
        System.out.println(didmatch);

        String mystring = quizLine.toString();

        int start = matcher.start();
        int end = matcher.end();

        System.out.println(start + " " + end);

        char a = mystring.charAt(0);
        char b = mystring.charAt(6);

        System.out.println(a + " " + b);



    }



}

在这一点上,我只是尝试匹配问题本身并留下多项选择答案,直到我解决这部分。是因为我的正则表达式模式错误吗?我什至尝试匹配一个简单的数字本身,但结果还是失败了(通过“^[0-9]{1}”)。

我做错了什么吗?我遇到的另一个问题是,这只是返回一场比赛,而不是全部。您将如何遍历字符串以查找所有匹配项?任何帮助,将不胜感激。

4

4 回答 4

1

我个人不会使用正则表达式,我只会在 \n 上使用 StringTokenizer,然后检查第一个字符是否为数字(因为似乎没有其他行以数字开头)。

但更具体地回答你的问题。您需要在模式上为 ^ 和 $ 指定 MULTILINE 标志以匹配行的开头和结尾。

Pattern pattern = Pattern.compile("^[0-9]{1}.+\\?", Pattern.MULTILINE);

这应该允许您的模式匹配文本中的行。否则 ^ 和 $ 只是匹配整个字符串的开头和结尾。

于 2013-07-12T02:54:58.883 回答
1

描述

此表达式将捕获整个问题,然后是所有可能的答案,前提是字符串的格式大致类似于您的示例文本

^\s*(\d+\.\s+.*?)(?=[\r\n]+^\s*\d+\.|\Z)

在此处输入图像描述

例子

现场示例:http ://www.rubular.com/r/dcetgPsz5w

给定示例文本

Intro to Computer Science


    1. Which of the following accesses a variable in structure b?
    A. b->var
    B. b.var
    C. b-var
    D. b>var

    2. Which of the following accesses a variable in a pointer to a structure, *b?
    A. b->var
    B. b.var
    C. b-var
    D. b>var



    3. Which of the following is a properly defined struct?
    A. struct {int a;}
    B. struct a_struct {int a;}
    C. struct a_struct int a
    D. struct a_struct {int a;}

    4. Which properly declares a variable of struct foo?
    A. struct foo
    B. foo var
    C. foo
    D. int foo

捕获第 1 组比赛

[0] => 1. Which of the following accesses a variable in structure b?
A. b->var
B. b.var
C. b-var
D. b>var
[1] => 2. Which of the following accesses a variable in a pointer to a structure, *b?
A. b->var
B. b.var
C. b-var
D. b>var
[2] => 3. Which of the following is a properly defined struct?
A. struct {int a;}
B. struct a_struct {int a;}
C. struct a_struct int a
D. struct a_struct {int a;}
[3] => 4. Which properly declares a variable of struct foo?
A. struct foo
B. foo var
C. foo
D. int foo
于 2013-07-12T03:02:04.620 回答
1

如果你 yse String.matches(),你只需要一小部分你正在尝试使用的代码。

要测试一行是否是一个问题:

if (line.matches("\\s*\\d\\..*"))

要测试一行是否是答案:

if (line.matches("\\s*[A-Z]\\..*"))
于 2013-07-12T03:04:02.543 回答
0
  1. 在代码中,quizLine 类似于“1.以下哪个访问结构 b 中的变量?\nA.b->var\nB.b.var\n...”。模式“^[0-9]{1}.+\?” 将尝试匹配整个字符串,这是不正确的。
  2. 简单的方法是 quizLine.split 并逐行匹配
  3. 另一种方法是如@Denomales 和@Chase 所述,使用多行匹配并获取匹配组。
  4. 正如@Bohemian 所说, String#matches 是检查字符串是否匹配但无法获取匹配组的好方法。如果您需要 Matcher,请注意 Matcher#lookingAt 与 Matcher#matches 略有不同。Matcher#matches 在您的情况下可能会更好。
于 2013-07-12T05:11:54.983 回答