1

以一种利他的方式,我想公开尽可能多的关于我的网站的结构化数据。我也不介意 SEO 提升,但它是次要的。

似乎有几个选择:

  • 完整的 RDF(现在杀了我 XML)
  • 带有您自己的自定义标签的 Atom(喜欢)
  • 网页中的 RDFa(可能有助于 SEO)
  • 都柏林核心元 的标签
  • 都柏林核心使用 RDFa
  • 带有 RDFa 的原子

我只是想让人们轻松地从我的网站上获取数据。

标准的好处是有很多可供选择的。

你觉得我应该用哪一个?

4

2 回答 2

4

RDF 不仅仅是 XML;RDF 是一种数据模型,它依赖于三元组(主语、谓语、宾语)和 URI 的集合来明确地引用事物。实际上,使用 RDF 的人倾向于远离 RDF/XML,我们更喜欢RDF/TurtleRDF/Ntriples,甚至是 JSON 格式的 RDF。这些序列化更易读、更容易构造和更容易解析。此外,还有许多工具可以让您在所有 RDF 风格之间进行转换(例如:rapperJena)。

在 RDF 中发布信息时。您通常有三种不同的选择:

  1. 提供数据的 RDF 转储。
  2. 按照关联数据规则发布 RDF 。
  3. 使用 RDFa 将元数据添加到现有网页。

...这些不是排他的。您可以选择它们的任意组合,最重要的是选择正确的 URI 结构(请参阅Cool URIs don't change)。

按照您的 SO 个人资料,我看到您正在开发一个社交品味推荐网站 (http://evocatus.com/)。我假设您可能想公开有关这些评论的信息。因此,对于像http://evocatus.com/sauce/cholula-chipolte-hot-sauce/272645/这样的评论,您可以提供不同的序列化,不仅可以返回 HTML,还可以返回:

  • .../holula-chipolte-hot-sauce/272645/rdf-turtle
  • .../holula-chipolte-hot-sauce/272645/rdf-xml
  • .../holula-chipolte-hot-sauce/272645/rdf-json
  • 一个用于您要公开的任何其他类型的格式。

此外,可以使用 RDFa 增强 HTML 版本。根据使用数据的客户端类型,遵循内容协商规则,您将 HTTP 请求重定向到客户端接受的任何格式。这是由 HTTP 标头建立的Accept。因此,像下面这样的请求curl将被您的应用程序重定向,并返回 RDF/XML 版本:

curl -H 'Accept: application/rdf+xml' .../holula-chipolte-hot-sauce/272645/

将来,人们只需在他们的 RDF 数据中重用您的 URI,就可以对您网站中的现有评论发表评论。这就是 RDF 和关联数据的力量。

关于Dublin Core,您可以将 Dublin Core 与 RDF 或 RDFa 一起使用。但是,在您的情况下,还有一些其他有趣的本体需要考虑,正确的做法是混合使用所有这些:

  • FOAF : Friend Of A Friend,表达用户个人信息和用户之间的关系。
  • Tag Ontology:一个非常简单的表示标签信息的本体。
  • RDF Review Vocabulary:使用 RDF 表达评论和评级的词汇。
  • GoodRelations:表达产品信息和电子商务的本体。
  • Vcard/RDF : 用于地址,通常与 FOAF 结合使用。

有一个名为http://revyu.com/的站点使用所有这些本体(GoodRelations 除外),因此您可以将其用作指南。参见例如:

...这些是同一评论的 HTML 和 RDF 版本。

正如您所见,与 ATOM 不同,使用 RDF,您将能够重用现有的本体,并且由于 RDF 基于 URI,因此所有内容都将相互关联。

关联数据附加值

如果您花时间将您的产品和评论链接到其他数据源会发生什么?(即:dbpedia.org 或 freebase.com)。假设您开始将所有啤酒评论 (http://evocatus.com/beer/) 链接到制造该产品的啤酒厂 (http://dbpedia.org/page/Alcoholic_beverage),通过以下链接例如,能够知道最好的啤酒是在哪里生产的。Dbpedia 拥有该信息。

另请参阅在还提供 RDF 版本的 Freebase 中,您可以链接到制造商。例如,参见RDF中的http://rdf.freebase.com/rdf/en.budweiser或 HTML 中的http://www.freebase.com/view/en/budweiser

于 2011-03-19T12:07:08.080 回答
2

Dublin Core Schema 是一小组词汇术语,可用于描述网络资源(视频、图像、网页等)。都柏林核心代码示例

 <meta name="DC.Format" content="video/mpeg; 10 minutes">

 <meta name="DC.Language" content="en" >

 <meta name="DC.Publisher" content="publisher-name" >

生成 DC.Meta 标签的链接:http ://www.dublincoregenerator.com/generator_nq.html

用于 SEO 目的的元标记中的 DC - 它们已过时。

发现使用 Dublin Core 元素并没有提高网页的检索排名”,并且“Dublin Core 元数据作为一种众所周知的元数据模式,并未被搜索引擎设计人员广泛接受和使用,并且蜘蛛不考虑它的元素同时对网页进行排名。

谷歌没有在他们的索引中使用它,也没有在谷歌或搜索引擎的网站上提到都柏林核心进行索引。

在英国,政府组织使用 DC 提供对标签的标准化访问。

这并不是说 Google、Bing、Yahoo 等永远不会实施它们。如今,谷歌正在使用更多的元数据和丰富的片段。

于 2014-03-05T09:34:57.340 回答