正如你所料,我处理的是一个主要使用Windows-1252作为字符集的遗留 Web 应用程序。
我还编写了一个小的库集,其中一个包含重音符号。这些文件采用 UTF-8 格式,并包含在遗留代码中。所以我在这里:
.------------。.-----------------。 | UTF-8 | | Windows-1252 | |------------| |-----------------| | 暗淡 | <-------- 包含-------- | 暗淡 str2 | | str = "é" | | str2 = "è" | |____________| |_________________|
听起来好像str2
将被处理为"è"
编码为UTF-8,尽管事实并非如此。
我知道非 ASCII 文字不应该写在代码中,但它是遗留的。此外,我承认我真的不想将 UTF-8 文件降级为 Windows-1252。此外,我正在寻找一种干净的方法来告诉引擎正确的字符串字符集,然后再将它们转换为其内部表示。Response.Codepage
似乎不相关或有效。在不将新文件转换为 Windows-1252 字符集的情况下,是否有其他干净的方法可以解决此问题?