我正在使用 C# 读取 PDF 文件,但字符来自另一种编码,并且返回的字符与我在 PDF 查看器中查看文件时预期的字符不同。
我认为 UTF-8 编码是正确的。
我究竟做错了什么?
string file = @"c:\document.pdf";
Stream stream = File.Open(file, FileMode.Open);
BinaryReader binaryReady = new BinaryReader(stream);
byte[] buffer = binaryReady.ReadBytes(Convert.ToInt32(stream.Length));
var encoder = UTF8Encoding.UTF8.GetString(buffer);