http - Erlang httpc:request 响应带有 UTF-8 编码的正文内容

翻译自：https://stackoverflow.com/questions/19163035 2013-10-03T15:22:31.277

679 次

我在使用 httpc:request 从网站获取正确编码的 UTF-8 内容时遇到了一些问题。

我有这个功能：

fetch(Url) ->
    httpc:request(get, {Url, [{"User-Agent", ?USERAGENT}]}, [{autoredirect, false}], [{body_format, binary}]).

我用它来称呼它：

fetch("http://chateauvolterra.com").

如果您查看该站点，您会发现它声明了 UTF-8 编码和一些 unicode 字符，例如“Château”。不幸的是，当我得到回复时，扩展字符是乱码。

我尝试以字符串和二进制格式获取 body_format，但两者都有相同的问题。我也尝试过 ibrowse 库，但似乎也有同样的问题。

是否有某种系统范围的编码设置可能会搞砸事情？

如何在不破坏文档中的 unicode 字符的情况下获取 HTTP 正文内容？

谢谢！

0 回答 0