上下文:我正在创建一个将其数据存储在 location.hash 中的应用程序。我想编码尽可能少的字符以保持最大的易读性。
正如此答案中所解释的,URL 的每个段的保留字符都不同。那么 URL Fragment/location.hash 具体有哪些限制呢?
相关文章: URL 中的 Unicode 字符
fragment = *( pchar / "/" / "?" )
pchar = unreserved / pct-encoded / sub-delims / ":" / "@"
unreserved = ALPHA / DIGIT / "-" / "." / "_" / "~"
pct-encoded = "%" HEXDIG HEXDIG
sub-delims = "!" / "$" / "&" / "'" / "(" / ")"
/ "*" / "+" / "," / ";" / "="
打开所有这些,忽略百分比编码,我发现以下字符集:
abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789-._~!$&'()*+,;=:@/?
尽管 RFC不强制规定特定的编码并且仅处理字符(不是字节),但根据第 2.3 节 ALPHA
,仅表示 ASCII,即拉丁字母表的 26 个字母。因此,任何非 ASCII 字母都必须进行百分比编码。