我有两个带有日志的文件(每个文件将近 5000 行)。每行中的文件都有一组与电子邮件相关联的规则,如下所示:
Y#12#EMAIL_1#RULE_1,RULE_2,RULE_3,RULE_4#time=993470174
Y#12#EMAIL_2#RULE_1,RULE_2,RULE_3,RULE_4#time=993470175
Y#12#EMAIL_3#RULE_1,RULE_2,RULE_3#time=9934701778
我使用以下函数读取文件,并获取每封电子邮件的规则:
private void processFile()
{
ArrayList<String[]> lSplitRules = new ArrayList<>();
try {
FileInputStream fileStream = new FileInputStream("log.log");
DataInputStream fileIn = new DataInputStream(fileStream);
BufferedReader fileBr = new BufferedReader(new InputStreamReader(fileIn));
String strLine;
while ((strLine = fileBr.readLine()) != null)
{
String[] lTokens = strLineSpam.split("#");
String lRawRules = lTokens[3];
lSplitRules.add(lRawRules.split(","));
}
} catch (FileNotFoundException e) {
System.out.println("File: log.log, not found. Error: " + e.getMessage());
} catch (IOException e) {
System.out.println("Couldn't open log.log. Error: " + e.getMessage());
}
到目前为止,一切都很好。在 ArrayList 的每个“空间”中,我将有一个 String[] 包含每封电子邮件的规则。另一方面,我还有一个包含一个唯一规则列表的 HashMap,它的值如下:
RULE_NAME - VALUE
RULE_1 - 0.1
RULE_2 - 0.5
RULE_3 - 0.6
...
我需要比较每封电子邮件的每条规则,看看它是否存在于 HashMap 中。如果存在返回一些计算的规则值,我使用这个函数:
private Double eval (String rule, Map<String, Double> scores)
{
for (Entry<String, Double> entry : scores.entrySet()) {
if (entry.getKey().equalsIgnoreCase(rule))
{
return entry.getValue();
}
}
return 0.0;
}
问题是我需要多次比较每封电子邮件及其规则(超过 10.000 条),因为我正在使用遗传算法来尝试优化每个规则的价值。有没有办法通过HASHMAP优化每封邮件的规则对比?由于我需要速度,我现在在 8 分钟内完成 100 次验证。
对不起我的英语不好。
问候