我正在尝试从浏览器中读取源代码,但是当代码中包含 ã、á、à、õ 等字符时,我会得到�。
我试图java.nio.Charset.encode
在读取行上应用,但没有结果:同样的事情发生了。
我的代码是:
URLConnection connection = ...;
BufferedReader reader = new BufferedReader(connection.getInputStream());
String s = null;
while ((s = reader.readLine()) != null) {
// got new source line...
}
我要阅读的网站是这个(PT-BR)。