优化Java扫描程序以更快地匹配文件中的正则表达式

Question

我目前正在使用此代码将正则表达式与许多文件进行匹配，但是，这相当慢。 有什么办法可以做同样的事情，但是更快吗？

public class Filter {
    private String title;
    private String regex;
    private List<String> results = new LinkedList<String>();
    ...
}

我有一些针对不同类型正则表达式的过滤器，它们的范围从匹配的电子邮件到匹配的单词（如apikey），...该代码将用于扫描反编译类和其他基于文本的文件中的漏洞。

我的代码也只检查文件中是否有1个匹配项，我想获取所有匹配项。

public void startScans() {
    List<File> files = getAllFiles(getFolder()); //Gets a list of all text based files in a folder
    for (int i = 0; i < files.size(); i++) {
        for(Filter filter : getFilters()) {
            try {
                System.out.print("\rScanning file " + i + " out of " + files.size() + " using filter " + filter.getTitle() + "...");
                scanFile(files.get(i), filter);
            } catch (FileNotFoundException ignored) {}
        }
    }
}

private void scanFile(File f, Filter filter) throws FileNotFoundException {
    Scanner scanner = new Scanner(f);
    String result = scanner.findWithinHorizon(filter.getRegex(), 0);
    if (result != null) {
        filter.addResult(result);
    }
    scanner.close();
}

Answer 1

如果想要更快的执行速度（即执行命令），也可以使用外部工具。 例如

Windows： findstr /R [az]*xyz *
Linux： egrep -R "[az]*xyz" .

_{注意：您可以从Java运行这些命令。}

优化Java扫描程序以更快地匹配文件中的正则表达式

问题描述

1 个解决方案

解决方案1
1 2015-07-16 11:15:25

优化Java扫描程序以更快地匹配文件中的正则表达式

问题描述

1 个解决方案

解决方案1 1 2015-07-16 11:15:25

解决方案1
1 2015-07-16 11:15:25