我正在使用 libcurl 来获取一些 HTML 页面。
HTML 页面包含一些字符引用,例如:סלקום
当我使用 libxml2 阅读此内容时,我得到: ׳₪׳¨׳~׳ ׳¨
是 ISO-8859-1 编码吗?
如果是这样,我如何将其转换为 UTF-8 以获得正确的单词。
谢谢
编辑:我得到了解决方案,MSalters 是对的,libxml2 确实使用 UTF-8。
我将此添加到 eclipse.ini
-Dfile.encoding=utf-8
最后我在我的 Eclipse 控制台上得到了希伯来语字符。谢谢