2

我是一名 PHP 开发人员,对 Semantic Web、Semantic Wiki、Semantic MediaWiki 等术语完全陌生。

几天前得到了有关 Semantic Wiki 的工作要求,然后我对此进行了很多探索,但没有得到确切的了解。

还是一头雾水..!!! 我有一些疑问,我想向你澄清。

  1. Semantic Wiki 究竟是什么?
  2. 它的目的是什么?
  3. 为什么以及何时使用它?
  4. 它是 PHP 框架还是类似的东西?

如果您以简单、真实的比较示例而不是 WikiPedia 或其他博客上的解释给我答案,我会更好。

任何帮助,将不胜感激。

4

1 回答 1

5

好吧,评论中提到的维基百科文章是相当理论的。它从需要一些解释的知识等术语开始。

我深吸一口气,试图解释一些事情……

1. 什么是语义 Wiki?

为简单起见,您可能知道什么是 Wiki。重点可能与语义有关,您对此进行了交流,但我在这里尝试总结一下。根据关于语义的维基百科文章,这是关于单词之间的关系。

当前的 Web 在很大程度上是句法的:人(或系统)需要知道页面的语言(包括语法)的句法才能捕捉单词的含义。这就是为什么我个人无法理解中文或阿拉伯文的页面,但会猜测荷兰语或丹麦语的内容:这些语言是欧洲语言,语法相似,词源接近我所知道的语言。

2001 年,Tim Berners-Lee(万维网之父)等人。在一篇开创性的文章中介绍了如果页面术语在语义方面作为语法信息的补充,Web 将变得非常有趣。这就是语义网的概念。这样的数据组织将有几个优点,包括谓词演算(也称为一阶逻辑-> 那篇文章很简洁)和国际化。谓词演算中的一个重要元素是关于数据质量。

语义主题确实很大:如果您真的感兴趣,那么您应该阅读有关它的书。

语义 Wiki 只是一个利用语义而非语法的 Wiki。它具有 Wiki 的优势:协作方面对于数据质量来说非常宝贵。注意:您有多个语义信息标准(RDF/OWL、Microdata/RDFA/JSON-LD)。

2. 它的目的是什么?

乍一看,语义网的主要兴趣在于搜索引擎:网页将更容易抓取语义信息。网络爬虫实际上是处理网页的主要应用程序。

借助一些工具(例如 RDF 解析器),语义结构化的 Wiki 也可能比纯语法 Wiki 更容易被第三方软件处理。客户可以轻松建立自己的知识库。

如果您想了解这种系统的浓厚兴趣,请考虑IBM Watson。但是为了这样的结果,需要庞大的基础设施

使用语义 Wiki 具有 Wiki 的优点。想想数据质量:对于 Watson,IBM 分析了 Wikipedia 的内容——他们讨论了用于该分析的UIMA 架构。第四部分是关于 DBPedia 的几句话,DBPedia 是一个分析维基百科文章语义的项目。

但是很少有非语义维基有维基百科的质量。

3. 为什么以及何时使用它?

为什么?使用语义系统有几个原因。语义系统最明显的用途是国际化。看看联合国教科文组织的英文中文阿拉伯文网站:三个不同的网站,提供纯句法解决方案。还有许多与演绎相关的其他优点(谓词演算主题)。Google知识图谱(简单_这里是关于影响功能的结构化数据的模糊点,而不是项目本身:几年后它可能会变得非常令人印象深刻)。大多数关于该主题的作品都是学术性的。需要庞大的基础设施才能拥有有效的系统。首先,你需要很好地理解语义网的问题。

对于when部分,我会说当您的项目得到大型组织的支持并且您真正熟悉该主题时。使用语义信息的另一种情况是帮助 Web 爬行。但据我所知,如果 Google 当前加载 Microdata/RDFA/JSON-LD,这对 Web 排名的影响非常轻微。

4. 它是 PHP 框架还是类似的东西?

我很难为您提供有关 PHP 解决方案的建议。

Ace Wiki就是一个很好的例子。链接页面可以访问作为示例的地理 Wiki 和项目的GitHub帐户。不幸的是,它是用 Java 编写的。

Semantic MediaWiki是 MediaWiki 的扩展,用于丰富页面的语义信息。它提供了一个 SPARQL 接口(知识库的 SQL)和一个 RDF 导出。这两个功能表明主要数据存储是基于图形的(我没有这方面的经验)。

不要误会:你会穿越DBPedia,但这不是语义 wiki。这是维基百科的语义形式。但是,这是一个非常重要的知识库。

于 2015-02-13T22:20:24.390 回答