0

如何强制 pdftohtml 输出为 UTF 8?

$ pdftohtml -enc utf8 my.pdf 
Error: Couldn't find unicodeMap file for the 'utf-8' encoding

而且-listenc似乎不是一个有效的选择。

我认为它默认使用 ISO-8859-1 (尽管出于某种原因,即使:set enc?报告,VIM 也能很好地读取文件和特殊字符utf-8

4

1 回答 1

1

请使用pdftohtml -enc UTF-8 file.pdf Like 运行命令:

$ pdftohtml -enc UTF-8 my.pdf
于 2021-08-27T01:09:04.383 回答