byte[] header = new byte[]{255, 216};
string ascii = Encoding.ASCII.GetString(header);
我希望 ASCII 等于 FFD8(JPEG SOI 标记)
相反,我得到“??????”
在这种情况下,您最好比较字节数组而不是转换为字符串。
如果您必须转换为字符串,我建议使用编码 Latin-1 aka ISO-8859-1 aka Code Page 28591 编码,因为此编码会将所有十六进制值在 0-255 范围内的字节映射到 Unicode 字符相同的十六进制值 - 在这种情况下很方便。以下任何一项都将获得此编码:
Encoding.GetEncoding(28591)
Encoding.GetEncoding("Latin1")
Encoding.GetEncoding("ISO-8859-1")
是的,那是因为ASCII只有 7 位 - 它没有定义任何高于 127 的值。编码通常将未知的二进制值解码为“?” (尽管这可以使用DecoderFallback进行更改)。
如果您要提及“扩展 ASCII”,我怀疑您实际上想要Encoding.Default
的是“操作系统的默认代码页”……我相信大多数西方系统上的代码页 1252。
你期待什么角色?
编辑:根据接受的答案(我怀疑这个问题是在我添加答案后被编辑的;我不记得最初看到任何关于 JPEG 的内容)你不应该将二进制数据转换为文本,除非它是真正编码的文本数据。JPEG 数据是二进制数据 - 因此您应该根据预期字节检查实际字节。
每当您使用“纯”文本编码(如 ASCII、UTF-8 等)将任意二进制数据(如图像、音乐或视频)转换为文本时,都存在数据丢失的风险。如果您必须将其转换为文本,请使用既美观又安全的 Base64。但是,如果您只想将其与预期的二进制数据进行比较,最好不要将其转换为文本。
编辑:好的,这是一个帮助给定字节数组的图像检测方法的类。我还没有让它特定于 HTTP。我不完全确定您是否应该真正获取InputStream
,只阅读一点,然后再次获取流。我通过坚持字节数组来回避这个问题:)
using System;
using System.Collections.Generic;
using System.Collections.ObjectModel;
using System.Linq;
public sealed class SignatureDetector
{
public static readonly SignatureDetector Png =
new SignatureDetector(0x89, 0x50, 0x4e, 0x47);
public static readonly SignatureDetector Bmp =
new SignatureDetector(0x42, 0x4d);
public static readonly SignatureDetector Gif =
new SignatureDetector(0x47, 0x49, 0x46);
public static readonly SignatureDetector Jpeg =
new SignatureDetector(0xff, 0xd8);
public static readonly IEnumerable<SignatureDetector> Images =
new ReadOnlyCollection<SignatureDetector>(new[]{Png, Bmp, Gif, Jpeg});
private readonly byte[] bytes;
public SignatureDetector(params byte[] bytes)
{
if (bytes == null)
{
throw new ArgumentNullException("bytes");
}
this.bytes = (byte[]) bytes.Clone();
}
public bool Matches(byte[] data)
{
if (data == null)
{
throw new ArgumentNullException("data");
}
if (data.Length < bytes.Length)
{
return false;
}
for (int i=0; i < bytes.Length; i++)
{
if (data[i] != bytes[i])
{
return false;
}
}
return true;
}
// Convenience method
public static bool IsImage(byte[] data)
{
return Images.Any(detector => detector.Matches(data));
}
}
如果您随后写道:
Console.WriteLine(ascii)
并期望“FFD8”打印出来,这不是 GetString 的工作方式。为此,您需要:
string ascii = String.Format("{0:X02}{1:X02}", header[0], header[1]);
我曾经写过一个自定义编码器/解码器,它将字节 0-255 编码为 unicode 字符 0-255 并再次返回。
它仅对在实际上不是字符串的东西上使用字符串函数非常有用。
你确定吗 ”????” 结果是什么?
结果是什么:
(int)ascii[0]
(int)ascii[1]
另一方面,纯 ASCII 只是 0-127...