Drools 是否适合为词干和/或 POS 标记编写规则?欢迎提出更好的规则语言的建议。我阅读了该领域的许多使用基于规则的方法的论文,但没有一篇提到使用什么库或框架来编写规则。
我的规则如下:
if (length = 3 & first_letter in group1 and second_letter in group2) then ...
if (length = 3 & first_letter in group1 and second_letter not_in group2) then ...
if (length = 3 & first_letter not_in group1 and second_letter in group2) then ...
if (length = 3 & first_letter not_in group1 and second_letter not_in group2) then ...
if (length = 4...
... 等等。
问题是这些规则太多而无法处理。想象一下有十个字母组,每个组中的每个字母都有一个大小写。我可以轻松地拥有一千多个规则来正确分类单词。我用纯 C# 代码编写了其中的 30 条规则,这足以让我看到这种方法的效率有多低。我已经把我的规则组织成纸上的树。我只需要正确的框架来插入、表示、调整和测试它们。
我希望我的问题很清楚。谢谢你。