我做了相当多的研究,但我无法理解这 3 之间的确切关系。另外,现在 W3C 已经正式认可 RDFa,你会推荐它而不是 Microdata,考虑到它匹配 Microdata 的功能等等吗?
3 回答
<sarcasm>我无法想象你会发现什么如此混乱</sarcasm>(编辑:这些标签以前是不可见的)
非常简短:
- 微格式一种将 html 页面用作人类可读文档和机器可读数据的方法,无需重复(例如,将 CSV 粘贴在 head 元素中)。
- RDF为网络设计的数据模型。无模式,使用 URL 来命名类型和关系。
- RDFa一种在 html 中编码(写入)RDF 的方法,遵循微格式的风格(即最小化重复)。通过向 html 添加一些属性来工作。
- 微数据RDFa 的替代品,使用不同的属性和不同的数据模型。
更简单地说,RDF 来自尝试使数据“webby”。甚至还有一个用于浏览 RDF 的前身 MCF 的插件(奇怪的是来自 Apple)。数据模型的设计使您可以编写您想要的内容,而无需与网络上的其他人预先安排如何列名称或关键含义。RDF 是使用 XML 标准编写(序列化)的(尽管还有其他更令人愉悦的格式)。
所以在这个世界上,你可能有一个可读的主页 ( me.html
) 和一个数据主页 ( me.rdf
) 供机器挖掘。那些机器不会理解 的含义,但如果他们查找“livesIn” <p>I live in <a href="http://example.com/Chicago">Chicago</a></p>
,他们可能会使用。:me ex:livesIn <http://example.com/Chicago>
微格式还试图使数据成为“webby”,或者应该是网络“data-y”。这里的见解是,在网页中,散文之间有很多数据。如果您有一些提示,机器可以计算出上面的那段 html 基本上是一个地址。这些提示是微格式。通常,他们使用围绕 html 类名的约定来指示内容不仅仅是文本。
所以微格式不需要机器的单独网页。但是由于它们的工作方式,微格式仅涵盖少数类型的数据(地址、朋友链接、位置……)。每个都是需要商定的特定约定。不小心使用它们也可能混合得很糟糕。
RDFa 试图同时获得 RDF 的灵活性和微格式的简单性。微数据是对 RDFa 的回应,但具有不同的数据模型(大致是数组和散列,而不是关系模型)。与微格式不同,它既不规定提供何种信息,也只规定其编码方式。
为了完成缺失的内容,我们现在拥有 schema.org,这是大型搜索引擎(Google、Bing、Yahoo、Yandex)发起的一项用于索引 Web 数据的倡议。schema.org 协调这些含义,以便搜索引擎知道,例如,事件有位置。微数据最初由 schema.org 使用,但现在支持微数据和 RDFa。
这些天我会忽略微格式并去 schema.org。我个人的喜好是 RDFa 编码,但无论是它还是微数据都应该可以正常工作。
我建议完全忽略语义网。因此,搜索引擎不会向您发送更多访问者。相反,他们将使用组织完善的数据来提供答案,而根本不会向您发送访问者。
今天你可以看到以下“电影框”示例的问题: https ://www.google.com/search?q=The+Godfather
显示 IMDb 和烂番茄评级。维基百科的片段也是如此。对用户好,对那些网站不好。或者您过去和今天访问 IMDb 的频率如何?
不要忘记。显示的数据不仅来自 IMDb 或烂番茄。日期、导演、奖项、音乐、图像等已从其他网站收集。例如,搜索引擎可以轻松地在其数据库中搜索“教父”+“导演”,如果 100 个网站中有 99 个包含名称“弗朗西斯·福特·科波拉”,则无需任何手动交互即可轻松验证答案。
最后,搜索引擎能够在那里构建自己的内容,而无需支付或提及作者。通过语义分类,您可以让他们更轻松。
这三者都是为了让网页内容更具语义化。
rdfa面临许多进入壁垒;它与 xml(rdfa 是基于 xml)在 web 早期所做的相同的成长痛苦,只是可能更重要,因为参与的开发人员较少。
我对 rdfa 知之甚少,无法通过微数据推荐它。我偏向于微数据,因为谷歌、雅虎和微软(现在的必应)联合起来创造了它。rdfa 正在开发中,微格式提案已经完成。此外,微格式已经在网络上大量生产和消费。所以三巨头决定串通一气,想出了微数据。我有点厌倦了,我想是因为我从根本上不明白为什么微格式被抛弃了。听起来像一堆烟雾和镜子。
所以我推荐微格式。他们太容易了。太棒了。您可以使用微数据实现哪些微格式无法实现的目标?
也就是说....我会选择微数据而不是 rdfa,因为它们同样简单。和数据属性远远优于 html 类。实际上,也许这就是最大的好处?数据属性?就像你的研究一样,我已经为微数据背后的原因寻找了很久很久,但我能找到的只是正常的、千篇一律的帖子。