0

我在使用 httpc:request 从网站获取正确编码的 UTF-8 内容时遇到了一些问题。

我有这个功能:

fetch(Url) ->
    httpc:request(get, {Url, [{"User-Agent", ?USERAGENT}]}, [{autoredirect, false}], [{body_format, binary}]).

我用它来称呼它:

fetch("http://chateauvolterra.com").

如果您查看该站点,您会发现它声明了 UTF-8 编码和一些 unicode 字符,例如“Château”。不幸的是,当我得到回复时,扩展字符是乱码。

我尝试以字符串和二进制格式获取 body_format,但两者都有相同的问题。我也尝试过 ibrowse 库,但似乎也有同样的问题。

是否有某种系统范围的编码设置可能会搞砸事情?

如何在不破坏文档中的 unicode 字符的情况下获取 HTTP 正文内容?

谢谢!

4

0 回答 0