来自生物科学的本体是一个代表一个非常简单的想法的词,但它是用其他不太常用的词来定义的。
由领域内的一组概念以及这些概念之间的关系对知识的正式表示
- 知识的表示,或“模型”
- 域或“主题”
- 一组概念,或“领域中的事物”
- 一组概念之间的关系
因此,在计算机科学术语中,它是一个图,其中节点对应于所有属于同一主题的事物,使用与主题相关的数据进行注释,并通过关系注释边连接到其他节点。
由于它是一种不太适合关系数据库的模型,因此如果您打算存储本体,您可能需要使用图形数据库,或者一种流行的关系数据库图形存储技术。
Ontologizes 没有在所有方面超越关系数据库的主要原因是因为关系数据库提供了一种简单的,即使不太灵活,连接两个项目的方法,外键。虽然这个键不允许大量注释来描述关系,但它确实限制了数据结构化方法的数量,防止人们创建各种关系(幸运的是,这意味着限制浪费关系的数量)。
例如,在基于本体的“家谱”数据库中
- 域是一棵树
- 该模型是家谱中的个人及其关系。
- 概念是家庭中的人。
- 关系将是表示“母亲”、“父亲”、“麻烦”、“姐妹”等的边缘。
请注意,现在是棘手的部分。你有“母亲”和“父亲”,但“父母”呢?如果你省略“parent”,你的查找逻辑会更复杂,所以让我们包含一个新的关系“parent”,这意味着一个人的“母亲”现在有两个链接,“母亲”和“父母”(就像父亲一样) .
“爷爷奶奶”呢?同样,这样做在逻辑上会将一些信息留在数据库之外,但存储它会增加维护数据库的开销。
“叔叔”、“阿姨”、“岳父”、“岳父”等都加入了一种新的关系,而本体背后的力量是你不受限制于你想要的那种关系加上; 然而,困难在于知道哪些关系直接影响解决方案(如果您不直接存储关系,通常会缺乏性能,因为您需要进行多个数据库查找才能找到“组合关系”)。