首先,我想将 pdf 文件转换为 html,但 api 不能这样做。
所以我尝试将pdf转换为txt。我有很多关于多个空格或行的问题......所以我(再次)尝试将 pdf 转换为单词和单词。这个词是完美的。
不幸的是,ConvertApi 无法将 word 转换为 html ......我可以找到一个免费的库来将 word 转换为 html。
所以我尝试(一次又一次)将word转换为txt。现在我在 txt 文件上有重音问题:
- 制度变成制度
- matière 变成 matiŠres
- 控制变成控制