9

许多博客使用“标签”和“类别”的概念将元数据添加到帖子中。对此信息进行语义标记的最佳实践是什么,以便阅读博客文章的机器可以轻松识别标签?

目前我添加"tag"rel链接上的属性,例如

<a rel="tag" class="tag" href="/tags.html#site-configuration">#site-configuration</a>

我想可以使用 Dublin Core 的 html 格式作为关键字:

<meta name = "DC.Subject"
          content = "site-configuration">

并将其添加到页眉中,或者元标记可以放在正文中吗?一个或另一个更可取,还是一些完全不同的选择?

在为内容提供精确和标准化的定义方面是否有更好的策略?

如果我想对元数据如此挑剔,或者我应该使用 XML 文档类型,HTML5 是一个合理的选择吗?

不同方法的优缺点是什么?

4

1 回答 1

16

第一步是在语义上正确获取/使用纯 HTML。section在 (X)HTML5 的情况下,您应该使用分段内容元素、articleaside和构建适当的大纲nav,并使用headerfooter将元数据内容与主要内容分开;还可以考虑内联级别的语义,例如time(发布日期)、dfn(定义)、abbr(缩写/首字母缩略词)等。并使用规范中定义的meta-name和值。rel

第二步是使用规范中未定义但在指定位置注册的元数据属性值(因此它们可以有效使用),例如元素name关键字meta//元素rel值。aarealink

第三是使用语义、机器可读的注释来增强标记。有三种常见的方法可以做到这一点

  • 微格式(使用预定义classrel值)
  • RDFa(使用属性和 URI)
  • 微数据(使用属性和 URI)

RDFa 和 Microdata 是相似的(可扩展且相当复杂),而 Microformats 更简单(但不是那么富有表现力/可扩展性)。我在 Programmers 上写了一个关于差异的简短答案,以及关于Microdata 和 RDFa 之间差异的更详细的答案。

对于 RDFa 或微数据,您的主要工作是找到能够描述/分类您的内容的词汇表/本体。每个人都可以创建这样的词汇表(您甚至可以自己创建一个),但通常建议使用众所周知/流行的词汇表,例如,以便搜索引擎可以使用您的注释(流行的例子:Schema.org)。

对于微格式,您必须找到适合您需要的微格式(在wiki at microformats.org上)。如果您的情况没有,您可以提出一个新的微格式(但如果有的话,这将需要一些时间才能被“接受”)。


如果我想对元数据如此挑剔,或者我应该使用 XML 文档类型,HTML5 是一个合理的选择吗?

如果您需要/想要 XML 支持,您也可以使用 XHTML5。如果您“仅”使用规范中定义的 (X)HTML 而没有额外的 XML 模式/词汇表,那么从语义的角度来看,您使用 HTML(5) 还是 XHTML(5) 并不重要。

于 2012-10-13T01:30:11.303 回答