0

我试图在很多类别(日期、年份、时间、名称、标点符号、电子邮件等)中发现适合它们的单词类型。我正在编写自己的代码来检测这一点(并且有效),但我发现了像 ANTLR 和 JavaCC 这样的库。

我想做的是为这些图书馆做些什么?如果是,我应该使用什么,如果不是,我可以使用什么?

有哪些建议?JavaCC,ANTRL,还有一些吗?我看到 JavaCC 生成了一些类,但是我不希望它做一些事情,比如标记化。

4

1 回答 1

2

取决于您需要的解析器有多强大。如果您需要一些非常强大的东西(例如 JavaCC 或 ANTLR),请使用它们,不要花太多时间尝试自己制作。

如果您需要一些简单的东西,那么您可以构建一个简单的字典查找解析器,只使用 Java 中的正则表达式,甚至是StringTokenizer(如果您的示例非常简单)。

于 2011-10-27T22:49:39.790 回答