2
byte[] header = new byte[]{255, 216}; 

string ascii =  Encoding.ASCII.GetString(header);

我希望 ASCII 等于 FFD8(JPEG SOI 标记)

相反,我得到“??????”

4

5 回答 5

11

在这种情况下,您最好比较字节数组而不是转换为字符串。

如果您必须转换为字符串,我建议使用编码 Latin-1 aka ISO-8859-1 aka Code Page 28591 编码,因为此编码会将所有十六进制值在 0-255 范围内的字节映射到 Unicode 字符相同的十六进制值 - 在这种情况下很方便。以下任何一项都将获得此编码:

Encoding.GetEncoding(28591)
Encoding.GetEncoding("Latin1")
Encoding.GetEncoding("ISO-8859-1")
于 2009-05-31T15:36:30.250 回答
8

是的,那是因为ASCII只有 7 位 - 它没有定义任何高于 127 的值。编码通常将未知的二进制值解码为“?” (尽管这可以使用DecoderFallback进行更改)。

如果您要提及“扩展 ASCII”,我怀疑您实际上想要Encoding.Default的是“操作系统的默认代码页”……我相信大多数西方系统上的代码页 1252

你期待什么角色?

编辑:根据接受的答案(我怀疑这个问题是在我添加答案后被编辑的;我不记得最初看到任何关于 JPEG 的内容)你不应该将二进制数据转换为文本,除非它是真正编码的文本数据。JPEG 数据是二进制数据 - 因此您应该根据预期字节检查实际字节。

每当您使用“纯”文本编码(如 ASCII、UTF-8 等)将任意二进制数据(如图像、音乐或视频)转换为文本时,都存在数据丢失的风险。如果您必须将其转换为文本,请使用既美观又安全的 Base64。但是,如果您只想将其与预期的二进制数据进行比较,最好不要将其转换为文本。

编辑:好的,这是一个帮助给定字节数组的图像检测方法的类。我还没有让它特定于 HTTP。我不完全确定您是否应该真正获取InputStream,只阅读一点,然后再次获取流。我通过坚持字节数组来回避这个问题:)

using System;
using System.Collections.Generic;
using System.Collections.ObjectModel;
using System.Linq;

public sealed class SignatureDetector
{
    public static readonly SignatureDetector Png =
        new SignatureDetector(0x89, 0x50, 0x4e, 0x47);

    public static readonly SignatureDetector Bmp =
        new SignatureDetector(0x42, 0x4d);

    public static readonly SignatureDetector Gif =
        new SignatureDetector(0x47, 0x49, 0x46);

    public static readonly SignatureDetector Jpeg =
        new SignatureDetector(0xff, 0xd8);

    public static readonly IEnumerable<SignatureDetector> Images =
        new ReadOnlyCollection<SignatureDetector>(new[]{Png, Bmp, Gif, Jpeg});

    private readonly byte[] bytes;

    public SignatureDetector(params byte[] bytes)
    {
        if (bytes == null)
        {
            throw new ArgumentNullException("bytes");
        }
        this.bytes = (byte[]) bytes.Clone();
    }

    public bool Matches(byte[] data)
    {
        if (data == null)
        {
            throw new ArgumentNullException("data");
        }
        if (data.Length < bytes.Length)
        {
            return false;
        }
        for (int i=0; i < bytes.Length; i++)
        {
            if (data[i] != bytes[i])
            {
                return false;
            }
        }
        return true;
    }    

    // Convenience method
    public static bool IsImage(byte[] data)
    {
        return Images.Any(detector => detector.Matches(data));
    }        
}
于 2009-05-31T14:47:23.233 回答
1

如果您随后写道:

Console.WriteLine(ascii)

并期望“FFD8”打印出来,这不是 GetString 的工作方式。为此,您需要:

 string ascii = String.Format("{0:X02}{1:X02}", header[0], header[1]);   
于 2009-05-31T14:55:23.823 回答
1

我曾经写过一个自定义编码器/解码器,它将字节 0-255 编码为 un​​icode 字符 0-255 并再次返回。

它仅对在实际上不是字符串的东西上使用字符串函数非常有用。

于 2009-05-31T20:25:20.270 回答
0

你确定吗 ”????” 结果是什么?

结果是什么:

(int)ascii[0]
(int)ascii[1]

另一方面,纯 ASCII 只是 0-127...

于 2009-05-31T14:48:56.990 回答