关于确定文本文件和网页的字符编码的讨论很多。
对于网页,似乎最好/最简单的方法是使用一个库,该库将 Url 作为输入并返回正确编码的字符串。由于库正在获取文档,因此它可以使用 HTTP 标头来帮助确定编码。
- http://htmlcleaner.sourceforge.net/download。
- 你如何以编程方式在 Java 中下载网页
- 使用java在网页中进行字符编码
- http://docs.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html
如果我们想使用 UrlFetch 获取文档,特别是异步 api,最好的方法是什么,库?用于确定编码。
是否有任何库与异步 urlfetch 集成(或可以轻松修改以集成)?