我最近开始使用语义网和链接数据技术,但我一直对一件事感到困惑。本体和词汇表有什么区别?哪个更可取?
5 回答
在最枯燥的意义上,“词汇表”是无上下文的术语列表,没有定义的相互关系。“本体”更丰富,暗示存在相互关系、公理、类等。
然而,术语“词汇表”几乎从未被用来表示“术语列表”,除非它在您正在谈论的本体的保护伞下。这两个术语有很多重叠,IMO 使用术语“词汇表”通常意味着一个本体,它不要求严格的形式哲学支持。
从文档:
受控词汇表是已明确列举的术语列表。该列表由受控词汇注册机构控制并可从其获得。受控词汇表中的所有术语都应具有明确的、非冗余的定义。受控词汇可能没有指定含义(它可能只是人们同意使用的一组术语,并且它们的含义被理解),或者它可能对每个术语都有非常详细的定义。
形式本体是用本体表示语言表达的受控词汇。这种语言有一个语法,可以使用词汇术语来表达在特定兴趣领域内有意义的东西。语法包含关于如何一起使用本体的受控词汇表中的术语的形式约束(例如,指定格式良好的语句、断言、查询等意味着什么)。
词汇和本体都是指一个事物。虽然他们有区别。
词汇
词汇是对事物是什么的理解。
例子:
苹果是一种水果。Apple 也是 Apple Inc. 公司的简称。
本体论
本体是对事物与其他事物的关系、异同的整体理解。
例子:
苹果 -> 是一种水果 -> 由苹果树生产 -> 有一个学名 -> Malus domestica -> 其中,Apple Inc. -> 得名
至于哪个更可取,因为您正在使用语义网络和链接数据技术,所以本体对您来说更有意义。
词汇是机器学习实验室从处理网络信息中得出的。在那个方向上的机器学习不会削减它。W3C 的人们意识到了这一点,并且为了进一步理解事物,语义 Web 和关联数据是他们的一些解决方案。这就产生了这个复杂的本体概念。
人类更容易理解词汇,而机器更容易理解本体。