[英]Java using regex to match a pattern for quizzes

我正在尝试做100个大型项目中的一个。 其中一个是关于一个测验制作者,它通过一个测验问题的档案进行解析,随机选择其中一些,创建一个测验,并对测验进行评分。



Intro to Computer Science

    1. Which of the following accesses a variable in structure b?
    A. b->var
    B. b.var
    C. b-var
    D. b>var

    2. Which of the following accesses a variable in a pointer to a structure, *b?
    A. b->var
    B. b.var
    C. b-var
    D. b>var

    3. Which of the following is a properly defined struct?
    A. struct {int a;}
    B. struct a_struct {int a;}
    C. struct a_struct int a
    D. struct a_struct {int a;}

    4. Which properly declares a variable of struct foo?
    A. struct foo
    B. foo var
    C. foo
    D. int foo

当然有很多这些问题,但它们都是相同的格式。现在我使用BufferedReader将这些问题加载到一个字符串中,并尝试使用正则表达式来解析它们。 但我无法匹配任何具体部分。 以下是我的代码:

    package myPackage;
    import java.io.*;
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;

public class QuizMaker {

    public static void main(String args[])

        String file = "myfile/QuizQuestions.txt";
        StringBuilder quizLine = new StringBuilder();
        String line = null;

        try {
            FileReader reader = new FileReader(file);

            BufferedReader buffreader = new BufferedReader(reader);

            while ((line = buffreader.readLine()) != null)


        } catch (FileNotFoundException e) {
            // TODO Auto-generated catch block
          catch (IOException e1) {



        Pattern pattern = Pattern.compile("^[0-9]{1}.+\\?");
        Matcher matcher = pattern.matcher(quizLine.toString());

        boolean didmatch = matcher.lookingAt();

        String mystring = quizLine.toString();

        int start = matcher.start();
        int end = matcher.end();

        System.out.println(start + " " + end);

        char a = mystring.charAt(0);
        char b = mystring.charAt(6);

        System.out.println(a + " " + b);



在这一点上,我只是试图在问题本身上进行匹配并留下多项选择答案,直到我解决这一部分。 是因为我的正则表达式模式错了吗? 我试着甚至匹配一个简单的数字本身甚至是失败的(通过“^ [0-9] {1}”)。

我做错了什么吗? 我遇到的另一个问题是,这只是返回一场比赛,而不是所有比赛。 你究竟如何遍历字符串以查找所有匹配项? 任何帮助,将不胜感激。

我个人不会使用正则表达式,我只会在\\ n上使用StringTokenizer,并检查第一个字符是否为数字(因为没有其他行似乎以数字开头)。

但更具体地回答你的问题。 您需要在模式上为^和$指定MULTILINE标志以匹配行的开头和结尾。

Pattern pattern = Pattern.compile("^[0-9]{1}.+\\?", Pattern.MULTILINE);

这应该允许您的模式匹配文本中的行。 否则^和$只匹配字符串的开头和结尾。





实例: http//www.rubular.com/r/dcetgPsz5w


如果你使用String.matches() ,你只需要一小部分你正在尝试使用的代码。


if (line.matches("\\s*\\d\\..*"))


if (line.matches("\\s*[A-Z]\\..*"))
  1. 在代码中,quizLine类似于“1.以下哪一个访问结构b中的变量?\\ nA.b-> var \\ nB.b.var \\ n ...”。 模式“^ [0-9] {1}。+ \\?” 将尝试匹配整个字符串,这是不正确的。
  2. 这样做的简单方法是quizLine.split,并逐行匹配
  3. 另一种方法是@Denomales和@Chase描述,使用多行匹配,并获得匹配组。
  4. 正如@Bohemian所说,String#matches是检查字符串是否匹配但是无法获得匹配组的好快捷方式。 如果你需要Matcher,请注意Matcher #lookingAt与Matcher#matches有点不同。 匹配#匹配可能会更好。


