我使用 MS Word 自动化将 .doc 保存到 .htm。如果 .doc 文件中有项目符号字符,它们会很好地保存到 .htm,但是当我尝试将 .htm 文件读入字符串时(因此我可以随后将其发送到数据库以作为字符串进行最终存储,而不是blob),项目符号会根据用于加载到字符串中的编码转换为问号或其他字符。
我正在使用它来阅读文本:
string html = File.ReadAllText(myFileSpec);
我也尝试过使用 StreamReader,但得到了相同的结果(可能是 File.ReadAllText 在内部使用的)。
我还尝试在 File.ReadAllText 的第二个重载中指定每种类型的编码:
string html = File.ReadAllText(originalFile, Encoding.ASCII);
我已经尝试了 Encoding 类型的所有可用枚举。
有任何想法吗?