Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个导入包含一些字符串的二进制文件的过程。字符串可以包含扩展的 ASCII,例如 CHR(224)、'à'。该过程采用 RAW 并将 BCD 字节一一转换为字符串中的字符。
问题是扩展的 ASCII 字符正在丢失。我怀疑这是由于它们的值在 UTF8 中意味着其他东西。
我认为我需要的是一个接受 ASCII 字符索引并返回适当 UTF8 字符的函数。
更新:如果我碰巧知道传入文本的等效 Oracle 字符集,我可以将原始字节转换为 UTF8 吗?源文本将始终为单字节。
没有“扩展 ASCII”之类的东西。或者,更准确地说,很多编码是 ASCII 的超集,共享相同的前 127 个代码点,以至于这个术语太模糊而没有意义。您需要确定此文件中的字符串是否使用 UTF-8、ISO-8859-whatever、MacRoman 等进行编码。
你问题第二部分的答案是一样的。UTF-8 在设计上是 ASCII 的超集。任何 ASCII 字符(即 0 到 127)也是 UTF-8 字符。要将一些非 ASCII 字符(即 >= 128)转换为 UTF-8,首先需要找出它的编码方式。