首先,我不确定您的方法对自然语言处理的适用性如何。另外,不是已经有 NLP 的库了吗?特别是在 NLP 中,我知道有时顺序和词性很重要,而且这种方法对于单词变化不是很健壮。
但是,如果你想坚持你的方法,一个让它更易读和更可维护的想法(见下面更全面的优点/缺点)是这样的:
StringFinder finder = new StringFinder(phrase);
if (finder.containsAll("turn", "on").andOneOf("computer", "pc").andNot("off").matches()) {
turnOnComputer();
return;
} else if (finder.containsAll("turn", "off").andOneOf("computer", "pc").andNot("on").matches()) {
turnOffComputer();
return;
} else if (finder.containsAll("turn", "on").andOneOf("light", "lamp").andNot("off").matches()) {
...
} else if (finder.containsAll("turn")) { // If we reached this point
badPhrase();
} else if (...
有类似的东西:
class StringFinder {
private final String phrase;
private final Map<String, Boolean> cache = new HashMap<String, Boolean>();
public StringFinder(String phrase) { this.phrase = phrase; }
public StringFinder containsAll(String... strings) {
for (String string : strings) {
if (contains(string) == false) return new FailedStringFinder(phrase);
}
return this;
}
public StringFinder andOneOf(String... strings) {
for (String string: strings) {
if (contains(string)) return this;
}
return FailedStringFinder(phrase);
}
public StringFinder andNot(String... strings) {
for (String string : strings) {
if (contains(string)) return new FailedStringFinder(phrase);
}
return this;
}
public boolean matches() { return true; }
private boolean contains(String s) {
Boolean cached = cache.get(s);
if (cached == null) {
cached = phrase.contains(s);
cached.put(s, cached);
}
return cached;
}
}
class FailedStringFinder extends StringFinder {
public boolean matches() { return false; }
// The below are actually optional, but save on performance:
public StringFinder containsAll(String... strings) { return this; }
public StringFinder andOneOf(String... strings) { return this; }
public StringFinder andNot(String... strings) { return this; }
}
缺点:
- 重复检查:“转”被检查多次。
- 重复模式(但请参阅下面的优点)。
优点:
- 相对简洁的代码。
- 检查被复制但被缓存,因此性能仍然很高。
- 条件非常接近操作,导致代码非常易读。
- 不嵌套条件允许在不重构代码的情况下更改特定操作所需的条件,从而产生更多可维护的代码。
- 易于更改条件和操作出现的顺序,以控制优先级。
- 缺少嵌套使得将来更容易并行化它。
- 灵活的条件检查:例如,您可以向 StringFinder 添加方法以匹配重复检查,例如:
public StringFinder containsOnAndNotOff() { return containsAll("on").andNot("off"); }
,或匹配您需要的一些奇异条件,例如andAtLeast3Of(String... strings) {...}
.
- 缓存也可以扩展为不仅记住单词是否出现,而且记住整个模式是否出现。
- 您还可以添加最终条件:(
andMatches(Pattern p)
使用正则表达式模式) - 事实上,您可能可以使用正则表达式对许多其他检查进行建模。然后它会使缓存变得容易——而不是使用字符串作为键,而是使用模式。