繁体   English   中英

如何读取java中文本文件的某部分

[英]How to read certain portion of the text file in java

我想读取文本文件中的某些部分并将这些部分中的每一个添加到相应的 ArrayList 中。这是一个示例文本文件:

format: pair_diploid
option: -b 50
option: -pp +
option: -mr masked
option: -n C:\Users\Fertilak\gimp\gimp
preprocess_script: cpp
source_files {
1   types.h 1
2   actions.c   2316
3   actions.h   1
4   editor-actions.c    91
5   editor-actions.h    1
287 test-clipboard.c    1247
}
source_file_remarks {
42
:   masked
152
:   masked
170
:   masked
}
clone_pairs {
5545    56.0-180    148.0-180
3083    62.1959-2107    62.2107-2255
3083    62.2107-2255    62.1959-2107
89  82.0-520    82.620-1140
89  82.620-1140 82.0-520
5545    148.0-180   56.0-180
12084   2865.633-694    2868.2877-2938
12084   2868.2877-2938  2865.633-694
}
clone_set_remarks {
}

我想添加到我的 2 ArrayList 的部分在 source_files 和 clone_pairs 中用方括号“{}”括起来。 因此,例如我想在 arraylist 源文件中添加所有数据,例如

    1   types.h 1
    2   actions.c   2316
...etc

它们包含在 source_files 括号中。 对于 clone_pairs 也是一样,我会将括号中的所有数据添加到 arrayList clonePairs。

这是我到目前为止所做的......但它不起作用。

    public void readFile(String file){
List<String> sourceFiles = new ArrayList<String>();
List<String> clonePairs = new ArrayList<String>();

            try{
                BufferedReader buff = new BufferedReader(new FileReader(file));
                
                try{
                    
                    String readBuff = buff.readLine();
                    while (readBuff != null){
                        if (readBuff.equals("source_files {") && !readBuff.equals("}")){
                            sourceFiles.add(readBuff);
                               }

                    else if (readBuff.equals("clone_pairs {") && !readBuff.equals("}")){
                            clonePairs.add(readBuff);
                               }

                        readBuff = buff.readLine();
                    }
                }
                finally{
                    buff.close();
                    }
            }
            
            catch(FileNotFoundException e){
                System.out.println("File not found");
            }
            catch(IOException e){
                System.out.println(e);
            }
            
        }

除了 if-else 条件外,这段代码中几乎所有内容都可以正常工作。 关于如何执行此操作的任何建议?

编辑

我已经编辑了内容并将其替换为 readBuff 字符串。 对不起

编辑 2

为了大家的利益,这是 Andrew Solution Code 提出的正确代码:

public void readFile(String file){
        try{
            BufferedReader buff = new BufferedReader(new FileReader(file));
            
            try{
                
                String readBuff = buff.readLine();
                String section = "";
                while (readBuff != null){
                    if (section.equals("source_files {") && !readBuff.equals("}")){
                        sourceFiles.add(readBuff);
                    } else if (section.equals("clone_pairs {") && !readBuff.equals("}")){
                        clonePairs.add(readBuff);
                    } else if (readBuff.equals("source_files {") || readBuff.equals("clone_pairs {")) {
                        section = readBuff;
                    } else if (readBuff.equals("}")) {
                        section = "";
                    }

                    readBuff = buff.readLine();
                }

            }
            finally{
                buff.close();
                }
        }
        
        catch(FileNotFoundException e){
            System.out.println("File not found");
        }
        catch(IOException e){
            System.out.println("exceptional case");
        }
    }

您正在构建的内容称为状态机。 你需要一些东西来跟踪你在文件中的位置 - 状态。 我称它为section

                String readBuff = buff.readLine();
                String section = "";
                while (readBuff != null){
                    if (section.equals("source_files {") && !readBuff.equals("}")){
                        sourceFiles.add(readBuff);
                    } else if (section.equals("clone_pairs {") && !readBuff.equals("}")){
                        clonePairs.add(readBuff);
                    } else if (readBuff.equals("source_files {") || readBuff.equals("clone_pairs {")) {
                        section = readBuff;
                    } else if (readBuff.equals("}")) {
                        section = "";
                    }

                    readBuff = buff.readLine();
                }

我认为在while的主体中使用if / else的方法只是简单的开销。 因为对于您要检查的每个循环:1。while循环中的条件2.循环中的每个if else。 然后当您遇到例如“source_files {”时,您仍在检查所有这些条件的每个循环。

在任何情况下,您都必须读取文件的每一行,如果您知道它们的定义顺序,那么这应该更有效:

此方法将启动BufferedReader。

private BufferedReader getBufferedReader(File file) {
    try{
        return new BufferedReader(new FileReader(file));
    }
    catch(FileNotFoundException e){
        e.printStackTrace();
    }
}

此方法将读取缓冲区的每一行,直到遇到起始字符串。 然后它会将每个下一行添加到列表中,直到遇到右括号。 并将返回您新制作的清单。

private List<String> readContent(BufferedReader buff, String start) {
    List<String> list = new ArrayList<String>();
    try {
        String readBuff;
        do {
            readBuff = buff.readLine();
        }
        while (readBuff != null && !readBuff.startsWith(start));

        do {
            readBuff = buff.readLine();
            list.add(readBuff);
        }
        while (readBuff != null && !readBuff.startsWith("}"));

    }
    catch(IOException e){
        e.printStackTrace();
    }
    return list;
}

最终你的方法看起来像这样。

    public void readLists(File file) {
        BufferedReader buff = getBufferedReader(file);
        List<String> sourceFiles = readContent(buff,"source_files {");
        List<String> clonePairs = readContent(buff,"clone_pairs {");
    }

这段代码基本上直接在while循环中读取文件的每一行一次,因此你不需要任何if / else。

如果您不知道文件中数据的顺序,则只需要if / else。 因此,此代码假定source_files首先出现,然后是clone_pairs。

另外,我使用startsWith,因为你的括号之后可能有一个空格,即“source_files {”会使等号失败。

我试过这个

public static void readFile(String file){
   List<String> sourceFiles = new ArrayList<String>();
   List<String> clonePairs = new ArrayList<String>();
   file = "test.txt";
   try{
       BufferedReader buff = Files.newBufferedReader(Paths.get(file));
       
       try{
           
           String readBuff = buff.readLine();
           boolean sourceStart = false;
           boolean cloneStart = false;
           boolean sourceEnd = false;
           while (readBuff != null){
               if(readBuff.equals("}")){
                   sourceEnd = true;
                   sourceStart=false;
                   cloneStart=false;
               }else {
                   sourceEnd = false;
               }
               if (sourceStart && !sourceEnd){
                   sourceFiles.add(readBuff);
               }
               else if (cloneStart && !sourceEnd){
                   clonePairs.add(readBuff);
                }
               
               if (readBuff.equals("source_files {")){
                   sourceStart=true;
               }
               
               if (readBuff.equals("clone_pairs {")){
                   cloneStart=true;
               }
               

               readBuff = buff.readLine();
           }
           
           sourceFiles.forEach(sf -> System.out.println(sf));
           System.out.println("---------------------");
           System.out.println("---------------------");
           
           clonePairs.forEach(cf -> System.out.println(cf));
       }
       finally{
           buff.close();
           }
   }
   catch(FileNotFoundException e){
       System.out.println("File not found exception");
   }
   catch(IOException e){
       System.out.println(e);
   }
   

}

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM