我是文本分析、UIMA 和 UIMA Ruta 相关技术的新手,并且正在开发一种用于智能文档处理的新软件(基于 Java)。目前,我正在阅读与 UIMA/Ruta 相关的所有阅读材料。我有一个问题但仍然不知道明确的答案是 UIMA Ruta 支持多少种不同的语言?对于我应该阅读哪些阅读材料(对于能够分析多种语言文档的智能文档处理软件),我会很乐意提供任何其他帮助/链接/文档。谢谢-拉胡尔
问问题
103 次
Ruta 本身是一种(脚本)语言,它与语言无关,本身不支持任何特定的(自然)语言集。您可以为任何语言编写 Ruta 脚本,例如英语、西班牙语、中文等。
例如,查看官方 Ruta 参考中的通过示例学习部分。它提供了一个简单的脚本,可以在英文文本中标记动物。显而易见,您可以通过调整示例代码中的正则表达式对任何语言执行相同的操作。
因此,您的系统将支持哪些语言完全取决于您的 Ruta 脚本,而不是 Ruta 本身。