我关于 SO 的第一个问题 :-)
背景:我正在开发需要过滤 HTTP 流量的软件。在处理需要检查 POST 请求内容的部分时,出现了如何解释接收到的与字符集相关的数据的问题。
为了知道我的代码应该在“Content-Type”标头中接受哪些字符集名称,我首先查找了一个详尽的字符集名称列表,然后发现:http ://www.iana.org/assignments/character-sets
(当然,这个列表太长了,无法全部支持,我将选择一个与我的案例相关的小子集。)
问题:从列表中,我认为“UTF8”(不带破折号)不是 IANA 定义的字符集名称,但它似乎有时仍然在使用,并且大多数服务器/浏览器都会理解它。我的过滤器应该能够理解 IANA 未列出的其他常见字符集名称的情况吗?
一般来说:某处是否有“更完整”的列表?
更具体地说:是否存在 IANA 未列出的 US-ASCII 字符集的别名?