我正在使用一个名为 Jsoup 的 HTML 解析器来加载和解析 HTML 文件。问题是我正在抓取的网页ISO-8859-1
在 Android 使用UTF-8
编码(?)时以字符集编码。这导致某些字符显示为问号。
所以现在我想我应该将字符串转换为 UTF-8 格式。
现在我在 Android SDK 中找到了这个名为CharsetEncoder的类,我想这对我有帮助。但是我不知道如何在实践中实现它,所以我想知道是否可以通过一个实际的例子来获得帮助。
更新:读取数据的代码(Jsoup)
url = new URL("http://www.example.com");
Document doc = Jsoup.parse(url, 4000);