以一种利他的方式,我想公开尽可能多的关于我的网站的结构化数据。我也不介意 SEO 提升,但它是次要的。
似乎有几个选择:
- 完整的 RDF(现在杀了我 XML)
- 带有您自己的自定义标签的 Atom(喜欢)
- 网页中的 RDFa(可能有助于 SEO)
- 都柏林核心元 的标签
- 都柏林核心使用 RDFa
- 带有 RDFa 的原子
我只是想让人们轻松地从我的网站上获取数据。
你觉得我应该用哪一个?
以一种利他的方式,我想公开尽可能多的关于我的网站的结构化数据。我也不介意 SEO 提升,但它是次要的。
似乎有几个选择:
我只是想让人们轻松地从我的网站上获取数据。
你觉得我应该用哪一个?
RDF 不仅仅是 XML;RDF 是一种数据模型,它依赖于三元组(主语、谓语、宾语)和 URI 的集合来明确地引用事物。实际上,使用 RDF 的人倾向于远离 RDF/XML,我们更喜欢RDF/Turtle或RDF/Ntriples,甚至是 JSON 格式的 RDF。这些序列化更易读、更容易构造和更容易解析。此外,还有许多工具可以让您在所有 RDF 风格之间进行转换(例如:rapper或Jena)。
在 RDF 中发布信息时。您通常有三种不同的选择:
...这些不是排他的。您可以选择它们的任意组合,最重要的是选择正确的 URI 结构(请参阅Cool URIs don't change)。
按照您的 SO 个人资料,我看到您正在开发一个社交品味推荐网站 (http://evocatus.com/)。我假设您可能想公开有关这些评论的信息。因此,对于像http://evocatus.com/sauce/cholula-chipolte-hot-sauce/272645/这样的评论,您可以提供不同的序列化,不仅可以返回 HTML,还可以返回:
此外,可以使用 RDFa 增强 HTML 版本。根据使用数据的客户端类型,遵循内容协商规则,您将 HTTP 请求重定向到客户端接受的任何格式。这是由 HTTP 标头建立的Accept
。因此,像下面这样的请求curl
将被您的应用程序重定向,并返回 RDF/XML 版本:
curl -H 'Accept: application/rdf+xml' .../holula-chipolte-hot-sauce/272645/
将来,人们只需在他们的 RDF 数据中重用您的 URI,就可以对您网站中的现有评论发表评论。这就是 RDF 和关联数据的力量。
关于Dublin Core
,您可以将 Dublin Core 与 RDF 或 RDFa 一起使用。但是,在您的情况下,还有一些其他有趣的本体需要考虑,正确的做法是混合使用所有这些:
有一个名为http://revyu.com/的站点使用所有这些本体(GoodRelations 除外),因此您可以将其用作指南。参见例如:
...这些是同一评论的 HTML 和 RDF 版本。
正如您所见,与 ATOM 不同,使用 RDF,您将能够重用现有的本体,并且由于 RDF 基于 URI,因此所有内容都将相互关联。
关联数据附加值
如果您花时间将您的产品和评论链接到其他数据源会发生什么?(即:dbpedia.org 或 freebase.com)。假设您开始将所有啤酒评论 (http://evocatus.com/beer/) 链接到制造该产品的啤酒厂 (http://dbpedia.org/page/Alcoholic_beverage),通过以下链接例如,能够知道最好的啤酒是在哪里生产的。Dbpedia 拥有该信息。
另请参阅在还提供 RDF 版本的 Freebase 中,您可以链接到制造商。例如,参见RDF中的http://rdf.freebase.com/rdf/en.budweiser或 HTML 中的http://www.freebase.com/view/en/budweiser。
Dublin Core Schema 是一小组词汇术语,可用于描述网络资源(视频、图像、网页等)。都柏林核心代码示例
<meta name="DC.Format" content="video/mpeg; 10 minutes">
<meta name="DC.Language" content="en" >
<meta name="DC.Publisher" content="publisher-name" >
生成 DC.Meta 标签的链接:http ://www.dublincoregenerator.com/generator_nq.html
用于 SEO 目的的元标记中的 DC - 它们已过时。
发现使用 Dublin Core 元素并没有提高网页的检索排名”,并且“Dublin Core 元数据作为一种众所周知的元数据模式,并未被搜索引擎设计人员广泛接受和使用,并且蜘蛛不考虑它的元素同时对网页进行排名。
谷歌没有在他们的索引中使用它,也没有在谷歌或搜索引擎的网站上提到都柏林核心进行索引。
在英国,政府组织使用 DC 提供对标签的标准化访问。
这并不是说 Google、Bing、Yahoo 等永远不会实施它们。如今,谷歌正在使用更多的元数据和丰富的片段。