1

目前,我有一个循环 System.in 进行数据处理的脚本。我从几个文件中传递数据给它cat

cat myfiles*.txt | java MyDataProcessor 

基于cat与 Java 直接打开文件相比增加了一些低效率的想法,我想将其优化为 Java 直接打开文件的位置:

java MyDataProcessor myfiles*.txt

是否有任何 Java 库使这变得相当容易(即处理将 posix 通配符转换为文件处理程序)?

4

5 回答 5

2

Java 7 添加了一个 PathMatcher 类,该类可用于根据 glob 验证路径名(类似于 shell 所做的匹配)

PathMatcher matcher = FileSystems.getDefault().getPathMatcher("glob:myfiles*.txt");
matcher.matches(filename);

可以在此处的 Oracle Java 教程中找到遍历文件树和基于 glob 搜索文件的示例

于 2012-11-01T21:12:53.113 回答
1

最好传递目录名称并通过目录树进行 Java 解析,而不是依赖特定于 shell 的“通配符”。

于 2012-11-01T20:26:28.533 回答
1

我会使用 java.io.File 遍历整个目录,然后使用正则表达式过滤文件名。您可以使用以下代码将通配符表达式转换为正则表达式:

    /**
 * Converts wildcard expression to regular expression. In wildcard-format,
 * '*' = 0-N characters and ? = any one character.
 * @param wildcardExp wildcard expression string
 * @param buf buffer which receives the regular expression
 */
static public void wildcardToRegexp(FastStringBuffer wildcardExp, FastStringBuffer buf) {
    final int len = wildcardExp.size();
    buf.clear();
    for (int i = 0; i < len; i++) {
        char c = wildcardExp.charAt(i);
        switch (c) {
        case '*':
            buf.append('.');
            buf.append('*');
            break;
        case '?':
            buf.append('.');
            break;
        // escape special regexp-characters

        case '(':
        case ')':
        case '[':
        case ']':
        case '$':
        case '^':
        case '.':
        case '{':
        case '}':
        case '|':
        case '\\':
        case '+':
            buf.append('\\');
            buf.append(c);
            break;
        default:
            buf.append(c);
            break;
        }
    }
}
于 2012-11-01T20:31:29.717 回答
1

查看Java Grep Library它与您的任务很接近,但没有通配符。

Apache 提供带有通配符的类: http: //cleanjava.wordpress.com/2012/03/21/wildcard-file-filter-in-java/

于 2012-11-01T20:31:46.073 回答
0

如果这对某人来说并不明显,因为起初对我来说不是,如果文件是本地的,那么您可以让 Posix 为您进行解析,并且文件将main(String[] args)作为参数传递给。就我而言,我还有一些其他参数,所以只需将通配符参数移到最后一个。

// USAGE: java MyProcessor arg1 arg2 myfiles*.txt

public static void main(String[] args) throws Exception {
  String arg1 = args[0];
  String arg2 = args[1];

  // looping over all input files
  for (int i = 2; i < args.length; i++) {
    File inputFile = new File(args[i]).getCanonicalFile();
    BufferedReader in = new BufferedReader(new FileReader(inputFile)); 
    // ...
  }
}
于 2012-11-01T21:37:44.700 回答