5

我在 Mac OSX 10.6.8 的终端中运行以下代码:

find . -name \*.html -type f -exec pandoc -o {}.md {} \;

它解析了一些文档,但在很多方面给了我这个错误:

pandoc: ./Teaching/how_16825_make-lesson-book.html: hGetContents: invalid argument (invalid byte sequence)

知道如何解决这个问题吗?

4

3 回答 3

3

有同样的问题我也看到这是在 Pandoc README.html 文件中:---

Pandoc 对输入和输出都使用 UTF-8 字符编码。如果你的本地字符编码不是 UTF-8,你应该通过 iconv 管道输入和输出:

iconv -t utf-8 输入.txt | 潘多克 | iconv -f utf-8

当然,您可能需要先安装 iconv(我相信 Mac Osx 已经拥有它)...

http://gnuwin32.sourceforge.net/packages/libiconv.htm Gnu Win32

https://code.google.com/p/win-iconv/ 谷歌 Win-Iconv

于 2013-01-27T01:52:12.343 回答
2

正如 kadeix 所说,这是一个字符编码问题。修改 html 中的字符集声明对我没有任何作用。

为了解决这个问题,我在 vim 中使用::w ++enc=utf-8

于 2012-11-29T17:36:33.377 回答
0

当我尝试解析以 latin-1 编码的文件时出现此错误。

当您收到此错误时,请在使用 pandoc 之前尝试将文件保存为 utf-8(并修改 html 代码中的字符集声明)。

于 2012-05-04T13:53:39.607 回答