我正在使用http://www.codeproject.com/Articles/91894/HTML-as-a-Source-for-a-DOCX-File将 HTML 转换为 docx 。
大多数字符都可以正确读取,但某些特殊字符(例如 •、“ ”)会显示为 •。我应该怎么做才能纠正这个问题?
我传递给 HTMLtoDocx 的 HTML 也没有正确读取特殊字符。相反,它显示为“?”。将编码更改为 Encoding.Default 后,它会返回正确的字符。在 HTMLtoDOCX 中有两个地方可以设置编码(下面的行)。在这两个地方,我都尝试将编码格式从 Encoding.UTF8 更改为 Encoding。但这没有帮助。
StreamWriter streamStartPart = new StreamWriter(docpartDocumentXML.GetStream(FileMode.Create, FileAccess.Write), Encoding.Default);
byte[] Origem = Encoding.Default.GetBytes(html);