在我的 C# 代码中,我从 PDF 文档中提取文本。当我这样做时,我得到一个 UTF-8 或 Unicode 编码的字符串(我不确定是哪个)。当我Encoding.UTF8.GetBytes(src);
将其转换为字节数组时,我注意到空格实际上是两个字节值分别为 194 和 160 的字符。
例如字符串“CLE action”看起来像
[67, 76, 69, 194 ,160, 65 ,99, 116, 105, 111, 110]
在一个字节数组中,其中的空格是 194 和 160... 因为这src.IndexOf("CLE action");
是在我需要它返回 1 时返回 -1。
如何修复字符串的编码?