843

我正在将一些东西从 VB 转换为 C#。此语句的语法有问题:

if ((searchResult.Properties["user"].Count > 0))
{
    profile.User = System.Text.Encoding.UTF8.GetString(searchResult.Properties["user"][0]);
}

然后我看到以下错误:

参数 1:无法从 'object' 转换为 'byte[]'

'System.Text.Encoding.GetString(byte[])' 的最佳重载方法匹配有一些无效参数

我试图根据这篇文章修复代码,但仍然没有成功

string User = Encoding.UTF8.GetString("user", 0);

有什么建议么?

4

18 回答 18

1499

如果您已经有一个字节数组,那么您将需要知道使用什么类型的编码将其放入该字节数组。

例如,如果字节数组是这样创建的:

byte[] bytes = Encoding.ASCII.GetBytes(someString);

您需要将其转回这样的字符串:

string someString = Encoding.ASCII.GetString(bytes);

如果您可以在继承的代码中找到用于创建字节数组的编码,那么您应该进行设置。

于 2013-04-18T00:54:23.140 回答
124

首先,添加System.Text命名空间

using System.Text;

然后使用此代码

string input = "some text"; 
byte[] array = Encoding.ASCII.GetBytes(input);

希望修复它!

于 2015-12-18T04:40:31.830 回答
51

您还可以使用扩展方法string类型添加方法,如下所示:

static class Helper
{
   public static byte[] ToByteArray(this string str)
   {
      return System.Text.Encoding.ASCII.GetBytes(str);
   }
}

并像下面这样使用它:

string foo = "bla bla";
byte[] result = foo.ToByteArray();
于 2017-06-22T14:59:57.467 回答
50

不应使用 Encoding.Default...

一些答案使用Encoding.Default,但微软对此提出警告

不同的计算机可以使用不同的编码作为默认值,并且默认编码可以在单台计算机上更改。如果您使用默认编码对计算机之间流式传输的数据进行编码和解码,或在同一台计算机上的不同时间检索数据,则可能会错误地转换该数据。此外,Default 属性返回的编码使用 best-fit fallback [即编码完全搞砸了,所以你不能重新编码它]将不支持的字符映射到代码页支持的字符。由于这些原因,不建议使用默认编码。为确保正确解码编码字节,您应该使用 Unicode 编码,例如 UTF8Encoding 或 UnicodeEncoding。您还可以使用更高级别的协议来确保使用相同的格式进行编码和解码。

要检查默认编码是什么,请使用Encoding.Default.WindowsCodePage(在我的情况下为 1250 - 遗憾的是,没有预定义的 CP1250 编码类,但可以将对象检索为Encoding.GetEncoding(1250))。

...应该改用UTF-8/UTF-16LE编码...

Encoding.ASCII得分最高的答案是 7bit,所以它也不起作用,就我而言:

byte[] pass = Encoding.ASCII.GetBytes("šarže");
Console.WriteLine(Encoding.ASCII.GetString(pass)); // ?ar?e

按照微软的建议:

var utf8 = new UTF8Encoding();
byte[] pass = utf8.GetBytes("šarže");
Console.WriteLine(utf8.GetString(pass)); // šarže

Encoding.UTF8别人推荐的是UTF-8编码的一个实例,也可以直接使用或者作为

var utf8 = Encoding.UTF8 as UTF8Encoding;

Encoding.Unicode在内存中的字符串表示中很受欢迎,因为它使用固定的每个字符 2 个字节,因此可以在恒定时间内以更多的内存使用为代价跳转到第 n 个字符:它是 UTF-16LE。在 MSVC# 中,*.cs 文件默认为 UTF-8 BOM,其中的字符串常量在编译时转换为 UTF-16LE(请参阅@OwnagesMagic 注释),但未将其定义为默认值:StreamWriter等许多类使用 UTF -8 作为默认值。

...但它并不总是使用

默认编码具有误导性:.NET 在任何地方都使用 UTF-8(包括在源代码中硬编码的字符串)和 UTF-16LE ( )将字符串存储在内存中,但WindowsEncoding.Unicode实际上使用 2 个其他非 UTF8 默认值:.NET 之前)和OEM 代码页(又名 DOS 标准)。这些因国家/地区而异(例如,Windows 捷克版使用 CP1250 和 CP852)并且通常在 Windows API 库中进行硬编码。因此,如果您只是将 UTF-8 设置为控制台(因为 .NET 隐式执行并假装它是默认设置)并运行一些本地化命令(如 ping),它可以在英文版本中运行,但您会在捷克共和国获得豆腐文本。chcp 65001

让我分享一下我的真实经历:我创建了 WinForms 应用程序,为教师定制了 git 脚本。输出是通过 Microsoft 描述为(我添加的粗体文本)的过程在后台异步获得的:

在此上下文中,“shell”一词(UseShellExecute)指的是图形 shell (ANSI CP)(类似于 Windows shell)而不是命令 shell(例如 bash 或 sh)(OEM CP),它允许用户启动图形应用程序或打开文档(在非美国环境中输出混乱)

因此有效地 GUI 默认为 UTF-8,进程默认为 CP1250,控制台默认为 852。所以输出在 852 中解释为 UTF-8,解释为 CP1250。我得到了豆腐文本,由于双重转换,我无法从中推断出原始代码页。我花了一周的时间来弄清楚为进程脚本显式设置 UTF-8 并在主线程中将输出从 CP1250 转换为 UTF-8。现在它在东欧工作,但西欧 Windows 使用 1252。ANSI CP 不容易确定,因为许多命令systeminfo也已本地化,其他方法因版本而异:在这种环境中可靠地显示国家字符几乎是不可行的。

因此,直到 21 世纪下半叶,请不要使用任何“默认代码页”明确设置(如果可能,设置为 UTF-8 或 UTF-16LE)。

于 2019-12-06T11:07:49.667 回答
48
var result = System.Text.Encoding.Unicode.GetBytes(text);
于 2017-09-29T04:31:58.107 回答
34
static byte[] GetBytes(string str)
{
     byte[] bytes = new byte[str.Length * sizeof(char)];
     System.Buffer.BlockCopy(str.ToCharArray(), 0, bytes, 0, bytes.Length);
     return bytes;
}

static string GetString(byte[] bytes)
{
     char[] chars = new char[bytes.Length / sizeof(char)];
     System.Buffer.BlockCopy(bytes, 0, chars, 0, bytes.Length);
     return new string(chars);
}
于 2014-04-28T19:47:54.310 回答
17

这对我有用

byte[] bytes = Convert.FromBase64String(textString);

反过来:

string str = Convert.ToBase64String(bytes);
于 2019-12-02T21:28:41.063 回答
13

Ali 的回答基础上,我会推荐一种扩展方法,允许您有选择地传入您想要使用的编码:

using System.Text;
public static class StringExtensions
{
    /// <summary>
    /// Creates a byte array from the string, using the 
    /// System.Text.Encoding.Default encoding unless another is specified.
    /// </summary>
    public static byte[] ToByteArray(this string str, Encoding encoding = Encoding.Default)
    {
        return encoding.GetBytes(str);
    }
}

并像下面这样使用它:

string foo = "bla bla";

// default encoding
byte[] default = foo.ToByteArray();

// custom encoding
byte[] unicode = foo.ToByteArray(Encoding.Unicode);
于 2019-05-10T12:35:29.877 回答
12

用这个

byte[] myByte= System.Text.ASCIIEncoding.Default.GetBytes(myString);
于 2015-06-30T14:43:05.347 回答
12

仅当字符为 1 字节时,以下方法才有效。(默认 unicode 不起作用,因为它是 2 个字节)

public static byte[] ToByteArray(string value)
{            
    char[] charArr = value.ToCharArray();
    byte[] bytes = new byte[charArr.Length];
    for (int i = 0; i < charArr.Length; i++)
    {
        byte current = Convert.ToByte(charArr[i]);
        bytes[i] = current;
    }

    return bytes;
}

保持简单

于 2016-03-04T18:57:25.140 回答
8

您可以使用MemoryMarshal API执行非常快速和高效的转换。String将隐式转换为ReadOnlySpan<byte>, 作为MemoryMarshal.Cast接受Span<byte>ReadOnlySpan<byte>作为输入参数。

public static class StringExtensions
{
    public static byte[] ToByteArray(this string s) => s.ToByteSpan().ToArray(); //  heap allocation, use only when you cannot operate on spans
    public static ReadOnlySpan<byte> ToByteSpan(this string s) => MemoryMarshal.Cast<char, byte>(s);
}

以下基准显示了差异:

Input: "Lorem Ipsum is simply dummy text of the printing and typesetting industry. Lorem Ipsum has been the industry's standard dummy text ever since the 1500s,"

|                       Method |       Mean |     Error |    StdDev |  Gen 0 | Gen 1 | Gen 2 | Allocated |
|----------------------------- |-----------:|----------:|----------:|-------:|------:|------:|----------:|
| UsingEncodingUnicodeGetBytes | 160.042 ns | 3.2864 ns | 6.4099 ns | 0.0780 |     - |     - |     328 B |
| UsingMemoryMarshalAndToArray |  31.977 ns | 0.7177 ns | 1.5753 ns | 0.0781 |     - |     - |     328 B |
|           UsingMemoryMarshal |   1.027 ns | 0.0565 ns | 0.1630 ns |      - |     - |     - |         - |
于 2019-10-16T13:09:25.470 回答
7

对 JustinStolle 编辑的改进(Eran Yogev 对 BlockCopy 的使用)。

建议的解决方案确实比使用编码更快。问题是它不适用于对长度不均匀的字节数组进行编码。如给定的那样,它引发了一个越界异常。从字符串解码时,将长度增加 1 会留下一个尾随字节。

对我来说,当我想从 to 编码时就需要DataTableJSON。我正在寻找一种将二进制字段编码为字符串并从字符串解码回byte[].

因此,我创建了两个类 - 一个包含上述解决方案(从字符串编码时很好,因为长度总是偶数),另一个处理byte[]编码。

我通过添加一个字符来解决不均匀长度问题,该字符告诉我二进制数组的原始长度是奇数('1')还是偶数('0')

如下:

public static class StringEncoder
{
    static byte[] EncodeToBytes(string str)
    {
        byte[] bytes = new byte[str.Length * sizeof(char)];
        System.Buffer.BlockCopy(str.ToCharArray(), 0, bytes, 0, bytes.Length);
        return bytes;
    }
    static string DecodeToString(byte[] bytes)
    {
        char[] chars = new char[bytes.Length / sizeof(char)];
        System.Buffer.BlockCopy(bytes, 0, chars, 0, bytes.Length);
        return new string(chars);
    }
}

public static class BytesEncoder
{
    public static string EncodeToString(byte[] bytes)
    {
        bool even = (bytes.Length % 2 == 0);
        char[] chars = new char[1 + bytes.Length / sizeof(char) + (even ? 0 : 1)];
        chars[0] = (even ? '0' : '1');
        System.Buffer.BlockCopy(bytes, 0, chars, 2, bytes.Length);

        return new string(chars);
    }
    public static byte[] DecodeToBytes(string str)
    {
        bool even = str[0] == '0';
        byte[] bytes = new byte[(str.Length - 1) * sizeof(char) + (even ? 0 : -1)];
        char[] chars = str.ToCharArray();
        System.Buffer.BlockCopy(chars, 2, bytes, 0, bytes.Length);

        return bytes;
    }
}
于 2015-03-29T14:31:09.873 回答
5

这个问题已经回答了很多次了,但是随着 C# 7.2 和 Span 类型的引入,在不安全的代码中可以更快地做到这一点:

public static class StringSupport
{
    private static readonly int _charSize = sizeof(char);

    public static unsafe byte[] GetBytes(string str)
    {
        if (str == null) throw new ArgumentNullException(nameof(str));
        if (str.Length == 0) return new byte[0];

        fixed (char* p = str)
        {
            return new Span<byte>(p, str.Length * _charSize).ToArray();
        }
    }

    public static unsafe string GetString(byte[] bytes)
    {
        if (bytes == null) throw new ArgumentNullException(nameof(bytes));
        if (bytes.Length % _charSize != 0) throw new ArgumentException($"Invalid {nameof(bytes)} length");
        if (bytes.Length == 0) return string.Empty;

        fixed (byte* p = bytes)
        {
            return new string(new Span<char>(p, bytes.Length / _charSize));
        }
    }
}

请记住,字节表示 UTF-16 编码的字符串(在 C# 领域中称为“Unicode”)。

一些快速的基准测试表明,对于中等大小的字符串(30-50 个字符),上述方法比它们的 Encoding.Unicode.GetBytes(...)/GetString(...) 实现快大约 5 倍,对于较大的字符串甚至更快。这些方法似乎也比使用带有 Marshal.Copy(..) 或 Buffer.MemoryCopy(...) 的指针更快。

于 2018-12-07T14:43:12.823 回答
3

如果 'searchResult.Properties [ "user" ] [ 0 ]' 的结果是一个字符串:

if ( ( searchResult.Properties [ "user" ].Count > 0 ) ) {

   profile.User = System.Text.Encoding.UTF8.GetString ( searchResult.Properties [ "user" ] [ 0 ].ToCharArray ().Select ( character => ( byte ) character ).ToArray () );

}

关键是可以使用 LINQ 将字符串转换为字节 []:

.ToCharArray ().Select ( character => ( byte ) character ).ToArray () )

反过来:

.Select ( character => ( char ) character ).ToArray () )
于 2018-12-16T23:53:14.283 回答
3

有谁知道为什么不这样做?

mystring.Select(Convert.ToByte).ToArray()
于 2017-04-12T16:25:49.320 回答
0

这已经得到了很多回答,但对我来说,唯一的工作方法是这个:

    public static byte[] StringToByteArray(string str)
    {
        byte[] array = Convert.FromBase64String(str);
        return array;
    }
于 2021-01-13T12:27:07.103 回答
0

这对我有用,之后我可以将我的图片转换为我数据库中的 bytea 字段。

using (MemoryStream s = new MemoryStream(DirEntry.Properties["thumbnailphoto"].Value as byte[]))
{
    return s.ToArray();
}
于 2019-02-06T09:36:31.900 回答
-3

谢谢帕维尔·马加

你的贡献可以这样完成:

    public static byte[] ToByteArray(this string s) => s.ToByteSpan().ToArray();
    public static string FromByteArray(this byte[] bytes) => ToCharSpan(new ReadOnlySpan<byte>(bytes)).ToString();
    public static ReadOnlySpan<byte> ToByteSpan(this string str) => MemoryMarshal.Cast<char, byte>(str);
    public static ReadOnlySpan<char> ToCharSpan(this ReadOnlySpan<byte> bytes) => MemoryMarshal.Cast<byte, char>(bytes);
于 2021-09-08T17:54:02.770 回答