我对计算语言学和 NLP 的文件很感兴趣。我读了很多关于语法框架(GF)的文章,它分为抽象语法和具体语法。我对 OWL、RDF 和 WordNet 有一点了解。我对这两种技术之间的差异感到困惑。
- 我们可以使用 GF 而不是 OWL 作为语法构建器吗?
- 我们可以通过使用 GF 来消除 Parser 吗?
- GF 是否包含所有术语,因此我们不需要使用 WordNet?
语法框架的正式定义之一是:
语法框架(GF),grammaticalframework.org,是一种多语言语法形式主义,基于共享抽象语法和抽象语法与具体语言之间的映射的思想。GF 在全球拥有数百名用户。
GF 连接到语义网的方式是通过柠檬:
Lemon 是一种用于建模词典和机器可读字典的模型,并链接到语义网和关联数据云。它旨在应对以下挑战:
- RDF-native 形式可以利用现有的语义 Web 技术(SPARQL、OWL、RIF 等)。
- 基于 LMF 的语言结构合理,可转换为现有的离线格式。
- 分离词典和本体层,以确保与现有 OWL 模型的兼容性。
- 链接到数据类别,以允许任意复杂的语言描述。
所以回答你的第一个问题,GF和OWL是相辅相成的。GF 本质上是一组可以在语言之间映射的语法规则,但是根据手头的任务,您可以使用 GF 开发强大的语义 Web 工具。例如,GF 可用于描述本体,正如在柠檬论文中所证明的那样。
对于第二个问题,是的。由于 GF 的中间级别是一组逻辑规则,因此您不再需要解析器。形态和基本语法映射就足够了(同样,你的目标是什么?正如定义所说,GF涵盖了基本语法。)
至于 WordNet:
WordNet® 是一个大型的英语词汇数据库。名词、动词、形容词和副词被分组为一组认知同义词(同义词),每个同义词表达一个不同的概念。同义词通过概念语义和词汇关系相互联系。
WordNet 可以被视为一种本体,但事实并非如此。它甚至不能称为语言本体。具有上位词和下位词关系不会使数据集成为本体。
柠檬或onlex试图实现的是创建一个可用于语言目的的本体。这个目的可以是注释、语料库研究、建模词典等。然而,WordNet 的强大之处在于它的同义词集(来自相同词汇类别的大致同义词被分组为同义词集。);但 RDF/OWL 的强大之处在于推理。
自从第一次提出这个问题以来的 4 年里,GF 有了一些更新。最重要的是,我们现在有一个移植到 GF 中的 WordNet,目前支持 13 种语言,并带有完整的变形表。您可以在https://github.com/GrammaticalFramework/gf-wordnet#readme中找到存储库,在http://www.grammaticalframework.org/~krasimir/gf-wordnet.html中找到多语言 Web 界面。如何使用接口的一些示例: