0

我的代码使用 servlet 语言逐行读取文本并在字符串缓冲区中每 5000 个单词填充字符串缓冲区,然后在 jsp 页面中显示内容,然后我将标题显示文本放入 utf-8 问题是当文本在utf-8 编码代码以未知字符读取它,我希望我的代码以 utf-8 读取文本,以 utf-8 编码向用户显示的文本是我用于读取文本的代码

 try{
   File file = new File(p);         
   l = (int) file.length(); 
   String s = null,strr=null;
   String g = null,m=null;
   int i = 0;
   Scanner input = new Scanner(file); 
   s1 = new StringBuffer();
   s2 = new StringBuffer();
   while (input.hasNextLine()) {
     g = input.nextLine();
     String[] d = g.split(" ");
     int h = d.length;
     i = i + h;
     if (i > 5000) {
       break;
     }
     s1.append(g).append(System.getProperty("line.separator"));
   }
   if(i > 5000) {
     s2.append(g).append(System.getProperty("line.separator"));
     while( input.hasNextLine()) {
     s = input.nextLine(); 
     String[] d = s.split(" ");
     int h = d.length;
     i=0;
     i=i+h;
     if (i > 5000) {
       break;
     }
     s2.append(s).append(System.getProperty("line.separator"));}
     if (input.hasNextLine()) {
       s3.append(s).append(System.getProperty("line.separator"));
       while(input.hasNextLine()) {
         strr = input.nextLine(); 
         s3.append(strr).append(System.getProperty("line.separator"));
       }
     }
   }
 input.close(); 
 } catch (Exception e) {
   e.getMessage();
 }
4

1 回答 1

0

检查您正在使用的方法的 javadocs - Scanner(File)构造函数让您知道:

使用底层平台的默认字符集将文件中的字节转换为字符。

相反,您可以调用Scanner(File, String)构造函数来显式指定文件编码:

Scanner input = new Scanner(file, "UTF-8");
于 2012-07-02T10:56:17.250 回答