如何使用 UTF-8 实体字符转换 doc 文件并自动将实体转换为其正确的十六进制 NCR 序列(例如ꯍ
)
以下是来自 doc 文件的示例文本:
Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.
将此转换为 txt 文件后,输出应为:
Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.
我做到了。
Document document = new Document();
string docPath = @"C:\Users\Tamal\Desktop";
document.LoadFromFile(Path.Combine(docPath,"op.docx"));
document.SaveToFile(Path.Combine(docPath,"op.txt"), FileFormat.Txt);
string readText = File.ReadAllText(Path.Combine(docPath,"op.txt"));
System.Diagnostics.Process.Start(Path.Combine(docPath,"op.txt"));
Console.ReadLine();
但这会将文本文件输出为(与 doc 文件完全相同):
Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.
如何以及在何处添加实体十六进制转换?
注意:我正在使用Spire.Doc将 doc 转换为 txt。