目前,我有一个循环 System.in 进行数据处理的脚本。我从几个文件中传递数据给它cat
。
cat myfiles*.txt | java MyDataProcessor
基于cat
与 Java 直接打开文件相比增加了一些低效率的想法,我想将其优化为 Java 直接打开文件的位置:
java MyDataProcessor myfiles*.txt
是否有任何 Java 库使这变得相当容易(即处理将 posix 通配符转换为文件处理程序)?
Java 7 添加了一个 PathMatcher 类,该类可用于根据 glob 验证路径名(类似于 shell 所做的匹配)
PathMatcher matcher = FileSystems.getDefault().getPathMatcher("glob:myfiles*.txt");
matcher.matches(filename);
最好传递目录名称并通过目录树进行 Java 解析,而不是依赖特定于 shell 的“通配符”。
我会使用 java.io.File 遍历整个目录,然后使用正则表达式过滤文件名。您可以使用以下代码将通配符表达式转换为正则表达式:
/**
* Converts wildcard expression to regular expression. In wildcard-format,
* '*' = 0-N characters and ? = any one character.
* @param wildcardExp wildcard expression string
* @param buf buffer which receives the regular expression
*/
static public void wildcardToRegexp(FastStringBuffer wildcardExp, FastStringBuffer buf) {
final int len = wildcardExp.size();
buf.clear();
for (int i = 0; i < len; i++) {
char c = wildcardExp.charAt(i);
switch (c) {
case '*':
buf.append('.');
buf.append('*');
break;
case '?':
buf.append('.');
break;
// escape special regexp-characters
case '(':
case ')':
case '[':
case ']':
case '$':
case '^':
case '.':
case '{':
case '}':
case '|':
case '\\':
case '+':
buf.append('\\');
buf.append(c);
break;
default:
buf.append(c);
break;
}
}
}
查看Java Grep Library它与您的任务很接近,但没有通配符。
Apache 提供带有通配符的类: http: //cleanjava.wordpress.com/2012/03/21/wildcard-file-filter-in-java/
如果这对某人来说并不明显,因为起初对我来说不是,如果文件是本地的,那么您可以让 Posix 为您进行解析,并且文件将main(String[] args)
作为参数传递给。就我而言,我还有一些其他参数,所以只需将通配符参数移到最后一个。
// USAGE: java MyProcessor arg1 arg2 myfiles*.txt
public static void main(String[] args) throws Exception {
String arg1 = args[0];
String arg2 = args[1];
// looping over all input files
for (int i = 2; i < args.length; i++) {
File inputFile = new File(args[i]).getCanonicalFile();
BufferedReader in = new BufferedReader(new FileReader(inputFile));
// ...
}
}