在 HTML 属性名称=值对中,“名称”部分允许使用哪些字符?..... 查看一些常见属性,似乎只使用了字母(az 和 AZ),但还允许使用哪些其他字符?...可能是数字 (0-9)、连字符 (-) 和句点 (.) ... 有这方面的规范吗?
5 回答
这取决于您所说的“允许”是什么意思。每个标签都有一个固定的有效属性名称列表,并且在 html 中它们不区分大小写。在一个重要的意义上,只有正确序列中的这些字符是“允许的”。
另一种看待它的方式是,浏览器会将哪些字符视为有效的属性名称。这里最好的建议来自 HTML 5 的解析器规范,可以在这里找到:https ://html.spec.whatwg.org/multipage/syntax.html#attributes-2
它表示除制表符、换行符、换页符、空格、斜线、大于号、引号、撇号和等号之外的所有字符都将被视为属性名称的一部分。就个人而言,我不会尝试推动这种极端情况。
假设您在谈论 XHTML,则适用 XML 规则。
见http://www.w3.org/TR/2008/REC-xml-20081126/#NT-Name
名称和令牌
[4] NameStartChar ::= ":" | [A-Z] | "_" | [a-z] | [#xC0-#xD6] | [#xD8-#xF6] | [#xF8-#x2FF] | [#x370-#x37D] | [#x37F-#x1FFF] | [#x200C-#x200D] | [#x2070-#x218F] | [#x2C00-#x2FEF] | [#x3001-#xD7FF] | [#xF900-#xFDCF] | [#xFDF0-#xFFFD] | [#x10000-#xEFFFF]
[4a] NameChar ::= NameStartChar | "-" | "." | [0-9] | #xB7 | [#x0300-#x036F] | [#x203F-#x2040]
[5] Name ::= NameStartChar (NameChar)*
[6] Names ::= Name (#x20 Name)*
[7] Nmtoken ::= (NameChar)+
[8] Nmtokens ::= Nmtoken (#x20 Nmtoken)*
自从提出这个问题以来,网络已经发展了很多。Web 组件(自定义元素)的作者很可能在这里尝试了解在自定义元素上定义属性时可以使用哪些有效名称。
这里有几个答案是部分正确的,所以我将尝试汇总它们并根据最近的规范更新它们。
首先,在 HTML5 中,属性名称可以以大多数字符开头,并且比以前的 HTML 版本更宽松。@S.Lott 的答案对于 HTML 2 和 XHTML 是正确的,但对于 HTML5 则不然。
对于 HTML5:(规范)
属性名称必须包含一个或多个字符,而不是空格字符、U+0000 NULL、U+0022 引号 (")、U+0027 APOSTROPHE (')、U+003E GREATER-THAN SIGN (>)、U+ 002F SOLIDUS (/) 和 U+003D 等号 (=) 字符、控制字符和任何未由 Unicode 定义的字符。在 HTML 语法中,属性名称,甚至是外来元素的名称,都可以用任何小写和大写字母的混合,是属性名称的 ASCII 大小写不敏感匹配。
话虽如此,这里的其他评论者是正确的,当在内置元素上使用不在其有效属性列表中的属性时,您在技术上违反了规范。浏览器作者对此有很大的容忍度,所以在实践中它并没有(太多?)伤害。许多库利用它来增强常规 HTML 标记,这会引起一些混乱,因为它在技术上不是有效的 HTML。HTML5 通过使用数据属性命名约定为属性中的自定义数据提供了一种机制。
这些规则对于自定义元素是不同的。
欢迎自定义元素作者为其元素实现他们喜欢的任何类型的属性,但属性的名称比 HTML5 更具限制性。实际上,规范要求属性名称遵循XML 名称限制:
ASCII 符号和标点符号以及相当大的一组 Unicode 符号字符被排除在名称之外,因为它们在 XML 名称用于 XML 文档之外的上下文中作为分隔符更有用;提供该组为这些上下文提供了关于哪些内容不能成为 XML 名称的硬性保证。字符#x037E,GREEK QUESTION MARK,被排除在外,因为规范化后它变成了一个分号,这可能会改变实体引用的含义。
名称和令牌
[4] NameStartChar ::= ":" | [AZ] | "_" | [az] | [#xC0-#xD6] | [#xD8-#xF6] | [#xF8-#x2FF] | [#x370-#x37D] | [#x37F-#x1FFF] | [#x200C-#x200D] | [#x2070-#x218F] | [#x2C00-#x2FEF] | [#x3001-#xD7FF] | [#xF900-#xFDCF] | [#xFDF0-#xFFFD] | [#x10000-#xEFFFF]
[4a] NameChar ::= NameStartChar | "-" | “。” | [0-9] | #xB7 | [#x0300-#x036F] | [#x203F-#x2040]
[5] 名称 ::= NameStartChar (NameChar)*
[6] 名称 ::= 名称(#x20 名称)*
[7] Nmtoken ::= (NameChar)+
[8] Nmtokens ::= Nmtoken (#x20 Nmtoken)*
因此,对于自定义元素名称,您可以使用大写/小写字母数字、“_”下划线、“:”冒号或规范中调用的任何 unicode 字符作为起始字符,然后使用破折号“-”、“点”。 "、alpha 等...作为正文字符。
也许我遗漏了一些东西,但我相信这个问题是基于错误的假设。在 HTML 中,属性是根据固定规范严格定义的。如果您“编造”自己的属性名称,则您不再编写有效的 HTML。
w3.org中列出了允许的值。如果添加自定义属性,则不再编写 HTML。