25

我刚刚读到这篇文章,它提到一些组织有一个本体作为(?)他们的数据库(?)层,并且这样做的决定是错误的。问题是我以前没有听说过这个,所以我不明白为什么它不好。

因此,我尝试在谷歌上搜索有关数据库和本体的信息,并从 2006 年获得了相当多的 pdf,其中充满了难以理解的内容(在我看来)。我读了其中的一些,在这一点上仍然完全不知道他们在说什么。

我目前的印象是,一些学者试图向我们推销,但由于他们的想法措辞而惨遭失败,这是 2006 年的一种疯狂时尚。但我仍然很好奇是否有人真的知道这到底是怎么回事。

4

9 回答 9

29

Karussell 已经提供了维基百科的定义:

“通过领域内的一组概念以及这些概念之间的关系对知识的正式表示”。

为了实现这种表示,已经开发了几种语言。目前最受关注的可能是Web Ontology Language (OWL)

在传统的关系数据库中,可以使用表来存储概念,但系统不包含有关概念含义以及它们如何相互关联的任何信息。本体确实提供了存储此类信息的方法,这允许以更丰富的方式存储信息。这也意味着可以构建相当高级和智能的查询。专门为此目的开发了诸如SPARQL之类的查询语言。

在我的硕士论文中,我使用了 OWL 本体,但这是一项相当学术研究的一部分。我不知道目前是否在实践中大量使用了这项技术,但我确信潜力是存在的。

更新:示例

一个关于本体的“意义”和推理的例子:假设你在你的本体中定义了一个 classPizza和一个 class Vegetarian Pizza,这是一个PizzaIngredients属于 class 的 class Meat。如果您现在创建一个Pizza恰好没有任何肉类成分的 a 实例,系统可以自动推断您的比萨饼也是 a Vegetarian Pizza,即使您没有明确指定它也是如此。

于 2010-03-25T11:14:02.670 回答
10

本体是描述域中的类型(可能还有一些个体)、类型和个体之间可能存在的关系以及个体和属性组合方式的约束的模式(模型)。

一个类比是 UML 类图 - 但本体具有形式语义,因此可以被机器解释,而不仅仅是供人类消费的图表。

示例

:项目、人员、项目经理。ProjectManager 是 Person 的子类(显然)。人和项目是脱节的

关系:工作,管理。Manages 是worksOn 的子属性

约束:人们在项目上工作,而不是相反。只有项目经理可以管理项目。

这个简单的例子可以进行机器推理,例如,如果 X 管理 Y,那么我们可以推断 Y 是一个项目,而 X 是一个项目经理,因此是一个人。

于 2011-05-07T20:15:22.367 回答
5

曾几何时,我将这样的问题分配给一个优秀的开发人员作为一项任务来回答,因为我的上级相信本体论。它没有得到任何尖锐的回答,我的上司在一段时间后被解雇了。我还是很好奇。

我目前的理解是,这是一种自然语言(或“实体”)中的单词以不同的关系相互连接的想法。然后我们将这个想法推广到任何数据库实体。基本上,我们最终没有什么有趣的东西,也没有有用的查询语言。

我可能错了。

于 2010-03-25T11:00:28.613 回答
5

人工智能人在某些时候认为,如果我们想要构建一个能够以某种方式认为我们应该使系统以某种方式了解我们对世界的了解的系统。换句话说,他们想通过生成一个数据库来将我们对这个词的理解强加给计算机,该数据库几乎包含关于我们所知道的概念和实体的信息和简明定义。这样的数据库是用不同的算法构建的,但毕竟不是很精确。你最好看看一个数据库,它被称为 CYC 中最好的数据库。 http://sw.opencyc.org/ 勾选方框中的几个字,看看你会得到什么作为回报。最良好的祝愿

于 2012-07-18T15:28:13.687 回答
2

维基百科呢?

本体是通过领域内的一组概念以及这些概念之间的关系对知识的正式表示

有关更多详细信息,请参阅“领域本体”和thisthat

于 2010-03-25T11:00:34.850 回答
1

上面的一些评论似乎有点不屑一顾。我在实际产品中使用了本体数据库,这是解决问题的唯一方法。本体可以用来创建一个数据库,它可以比关系数据库更好地包含现实世界的复杂性。“信息”多于“数据”。当关系复杂且信息集庞大且不完整时,它尤其有用。一个好的本体数据库中的查询机制尤其简洁——它智能地使用模式/本体(例如任何类层次结构)来返回否则无法找到的答案。

于 2018-03-17T16:27:29.260 回答
1

很久以前,我使用了斯坦福大学(Protege)开发的一个本体数据库。

这个想法是为了跟踪参考资料。书籍有作者和引文。引用有一个书的链接,以及一个页码。作者有书籍链接,书籍有出版商、出版日期、作者链接。文章和视频也是如此。

这个想法是插入一个引用,并且可以随时访问属性,所以我下次使用它时不再需要跟踪引用是在哪本书和页面中找到的。

本体数据库为数据建模提供了一种极好的方法。但使用它是另一回事。与从 Word 文档中复制完整的引用和参考信息相比,从数据库中提取参考的部分所需的时间更多。

使类似的东西真正有用所需要的只是集成到文字处理器中。(理想情况下,您会或多或少地正常添加引用,然后保存它们以供以后重复使用,以及指向您使用位置的链接!:__)

于 2021-02-10T23:19:04.970 回答
0

来自生物科学的本体是一个代表一个非常简单的想法的词,但它是用其他不太常用的词来定义的。

由领域内的一组概念以及这些概念之间的关系对知识的正式表示

  • 知识的表示,或“模型”
  • 域或“主题”
  • 一组概念,或“领域中的事物”
  • 一组概念之间的关系

因此,在计算机科学术语中,它是一个图,其中节点对应于所有属于同一主题的事物,使用与主题相关的数据进行注释,并通过关系注释边连接到其他节点。

由于它是一种不太适合关系数据库的模型,因此如果您打算存储本体,您可能需要使用图形数据库,或者一种流行的关系数据库图形存储技术。

Ontologizes 没有在所有方面超越关系数据库的主要原因是因为关系数据库提供了一种简单的,即使不太灵活,连接两个项目的方法,外键。虽然这个键不允许大量注释来描述关系,但它确实限制了数据结构化方法的数量,防止人们创建各种关系(幸运的是,这意味着限制浪费关系的数量)。

例如,在基于本体的“家谱”数据库中

  • 域是一棵树
  • 该模型是家谱中的个人及其关系。
  • 概念是家庭中的人。
  • 关系将是表示“母亲”、“父亲”、“麻烦”、“姐妹”等的边缘。

请注意,现在是棘手的部分。你有“母亲”和“父亲”,但“父母”呢?如果你省略“parent”,你的查找逻辑会更复杂,所以让我们包含一个新的关系“parent”,这意味着一个人的“母亲”现在有两个链接,“母亲”和“父母”(就像父亲一样) .

“爷爷奶奶”呢?同样,这样做在逻辑上会将一些信息留在数据库之外,但存储它会增加维护数据库的开销。

“叔叔”、“阿姨”、“岳父”、“岳父”等都加入了一种新的关系,而本体背后的力量是你不受限制于你想要的那种关系加上; 然而,困难在于知道哪些关系直接影响解决方案(如果您不直接存储关系,通常会缺乏性能,因为您需要进行多个数据库查找才能找到“组合关系”)。

于 2020-08-24T07:22:37.890 回答
-1

我是一个完全的外行,但在我看来,人工智能研究有50 年的历史,循环往复。

  1. 学者的夸张预测。
  2. 政府慷慨资助。
  3. 产生了适度的结果。
  4. 资金被野蛮削减。
  5. 时间流逝。上一个循环被遗忘了。返回步骤 1。

我们已经循环了两次。说不定这一次会不一样……?

于 2010-05-17T17:14:26.213 回答