0

如何使用 UTF-8 实体字符转换 doc 文件并自动将实体转换为其正确的十六进制 NCR 序列(例如ꯍ

以下是来自 doc 文件的示例文本:

Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.

将此转换为 txt 文件后,输出应为:

Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.

我做到了。

Document document = new Document();

    string docPath = @"C:\Users\Tamal\Desktop";
    document.LoadFromFile(Path.Combine(docPath,"op.docx"));
    document.SaveToFile(Path.Combine(docPath,"op.txt"), FileFormat.Txt);

    string readText = File.ReadAllText(Path.Combine(docPath,"op.txt"));
    System.Diagnostics.Process.Start(Path.Combine(docPath,"op.txt"));
    Console.ReadLine();

但这会将文本文件输出为(与 doc 文件完全相同):

Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.

如何以及在何处添加实体十六进制转换?

注意:我正在使用Spire.Doc将 doc 转换为 txt。

4

1 回答 1

0

通过 System.Net.WebUtility.HtmlEncode(string) 运行您的字符串

于 2018-05-06T14:38:00.967 回答