我有一个日志文件列表,我需要找到哪一个具有特定行的最新版本,并且所有或没有都可以具有此行。
文件中的行如下所示:
2013/01/06 16:01:00:283 INFO ag.doLog: xxxx xxxx xxxx xxxx
我需要一条线让我们说
xx/xx/xx xx:xx:xx:xxx INFO ag.doLog: the line i need
我知道如何获取文件数组,如果我向后扫描,我可以在每个文件中找到最新的行(如果存在)。
最大的问题是文件可能很大(2k 行?),我想以相对快速的方式(几秒钟)找到该行,所以我愿意接受建议。
个人想法:如果一个文件在X时间有行,那么在X时间之前没有找到该行的任何文件都不应该再扫描了。这将需要同时搜索所有文件,我不知道如何。
Atm 代码中断,我想如果内存不足。
代码:
if(files.length>0) { //in case no log files exist
System.out.println("files.length: " + files.length);
for(int i = 0; i < files.length; i++) { ///for each log file look for string
System.out.println("Reading file: " + i + " " + files[i].getName());
RandomAccessFile raf = new RandomAccessFile(files[i].getAbsoluteFile(), "r"); //open log file
long lastSegment = raf.length(); //Finds how long is the files
lastSegment = raf.length()-5; //Sets a point to start looking
String leido = "";
byte array[] = new byte[1024];
/*
* Going back until we find line or file is empty.
*/
while(!leido.contains(lineToSearch)||lastSegment>0) {
System.out.println("leido: " + leido);
raf.seek(lastSegment); //move the to that point
raf.read(array); //Reads 1024 bytes and saves in array
leido = new String(array); //Saves what is read as a string
lastSegment = lastSegment-15; //move the point a little further back
}
if(lastSegment<0) {
raf.seek(leido.indexOf(lineToSearch) - 23); //to make sure we get the date (23 characters long) NOTE: it wont be negative.
raf.read(array); //Reads 1024 bytes and saves in array
leido = new String(array); //make the array into a string
Date date = new SimpleDateFormat("MMMM d, yyyy", Locale.ENGLISH).parse(leido.substring(0, leido.indexOf(" INFO "))); //get only the date part
System.out.println(date);
//if date is bigger than the other save file name
}
}
}