2

有人可以建议任何能够从非结构化数据中解析日期/时间日历事件的 Java 库。例子

  • 今晚10点开始!2 月 10 日星期日 => 2013 年 2 月 10 日晚上 10 点
  • 明天(2 月 10 日)=> 2013 年 2 月 10 日
  • 2 月 10 日星期日\r\n每天放映至 2 月 16 日

等等

输入数据来自用户,因此他可以输入任何随机格式的数据。我开始识别所有可能的标记并进行正则表达式匹配来表达所有标记。我想知道是否有人可以建议一些 Java 库,这实际上可能有助于解析。

我浏览了关于 SO 的其他帖子,但他们似乎建议了技术,我想知道是否有人有图书馆。

谢谢

4

2 回答 2

0

您可以从http://opennlp.apache.org/上的 Apache openLNP(自然语言处理)获取一些主干源代码,或者通过在您的服务器上实现 openNLP 来设置一个可调用的 RESTful Web 服务。实施 OOB openNLP 的好处是您可以通过 nameFinder 接口获取日期、时间、组织、位置和人员的实体提取器。您还可以为感兴趣的项目构建一个更典型的上下文示例文件,指示其适当的实体类型,并针对它训练 NLP 模型以获得更好的上下文命中率。我在http://www.augmentedintel.com/apps/csharpnlp/extract-names-from-text.aspx的投资组合的应用程序部分中有一个 C# NLP 的工作示例。

于 2013-04-26T14:01:23.157 回答
0

UTAH ( https://github.com/sonalake/utah-parser ) 能够将非结构化文本通用解析为地图。完成后,您应该可以将其放入格式化程序中。

于 2016-04-01T22:37:05.560 回答