0

我正在尝试从 HTML 页面获取一些文本,我可以正确下载,但西班牙语(á、é、í、ó、ú)和可能其他特殊字符(ü)的重音符号显示为带有 ? 标记里面。

一旦我使用的 InputStreamReader 调用了 read 函数,文本已经像这样出现了,但是 HTML 页面和存储内容的数据库都很好。

无论如何要向 InputStreamReader 指定它应该期望什么字符编码?我最初在数据库中使用utf8_general_ci,然后将其显示到获取文本的php页面中。

谢谢。

private String DownloadText (String URL)
{
    int BUFFER_SIZE = 2000;
    InputStream in = null;
    try
    {
        in = OpenHttpConnection(URL);
    }
    catch (IOException e)
    {
        return "";
    }

    InputStreamReader isr = new InputStreamReader(in);
    int charRead;
    String str = "";
    char[] inputBuffer = new char[BUFFER_SIZE];
    try
    {
        charRead = isr.read(inputBuffer);
        str = String.copyValueOf(inputBuffer,0,charRead);
        inputBuffer = null;
        in.close();
    }
    catch(IOException e)
    {
        return "";
    }
    return str;
}
4

2 回答 2

1

尝试添加此标题

header('Content-Type: text/html; charset=utf-8' );

在你像这样连接到你的数据库之后

// Connect to server and select database.
$login = mysql_connect("www.yoursite.com","username","password") 
or die (mysql_error());
mysql_select_db("yourDatabase", $login);

添加这两行

mysql_query("SET NAMES 'utf8'");
mysql_query('SET CHARACTER SET utf8');
于 2013-07-19T10:16:18.513 回答
0

尝试这个:

    BufferedReader br = new BufferedReader(new InputStreamReader(in, "UTF-8"), BUFFER_SIZE);
    String str;
    try
    {
        while ((str = br.readLine()) != null) {
            file += str;
        }
    }
    catch(IOException e)
    {
        return "";
    }
于 2013-07-19T10:36:02.960 回答