我有下面的 readfile() java 函数来读取 .htm 文件
private String readfile(String inputDoc) throws IOException {
FileInputStream fis = null;
InputStreamReader isr = null;
String text = null;
//open input stream to file
fis = new FileInputStream(inputDoc);
isr = new InputStreamReader(fis, "UTF-8");
StringBuffer buffer = new StringBuffer();
int c;
while( (c = isr.read()) != -1 ) {
buffer.append((char)c);
}
text = buffer.toString();
isr.close();
return text;
}
这是输入文档的示例片段
<?xml version="1.0" encoding="utf-8"?><html>
<head>
由于某种原因,从 readfile() 返回的文本字符串是<?xml version="1.0" encoding="utf-8"?><html>\r\r\n<head>
但我希望它是 <?xml version="1.0" encoding="utf-8"?><html>\r\n<head>
正如这里概述的那样,windows 中的换行符 \r\n
我在 Windows 7 上的 IntelliJ Idea 中运行了上述函数。(IDEA 默认编码设置为 UTF-8)
有谁知道为什么我从换行的 readfile(String inputDoc) 函数中得到这个奇怪的结果