4

我需要使用指定的字符集从 OFFSET 的文本文件中读取 char[](大小为 COUNT)。COUNT 和 OFFSET 是字符,而不是字节。他是我的代码:

raf = new RandomAccessFile(filePath, "r");      
if ((mBuffer == null) || (mBuffer.length < count)) {
    mBuffer = new byte[(int)(count/mDecoder.averageCharsPerByte())];
    mByteWrap = ByteBuffer.wrap(mBuffer);
    mCharBuffer = new char[count];
    mCharWrap = CharBuffer.wrap(mCharBuffer);
}
try {
    offset = (int)(offset/mDecoder.averageCharsPerByte());
    count = (int)(count/mDecoder.averageCharsPerByte());
    raf.seek(offset);
    raf.read(mBuffer,0,count);
    mByteWrap.position(0);
    mCharWrap.position(0);
    mDecoder.decode(mByteWrap, mCharWrap, true);
} catch (IOException e) {
    return null;
}
return mCharBuffer;

有没有更简单的方法?(无需手动匹配 char->byte)

我正在寻找 java.util.Scanner,但它是 Iterator 风格的,我需要随机访问风格。

PS数据不应该被复制多次

4

2 回答 2

4

使用 BufferedReader 的skip()方法。在你的情况下:

BufferedReader reader = new BufferedReader(new FileReader(filePath));
reader.skip(n); // chars to skip
// .. and here you can start reading

如果你想指定一个特定的编码,你可以使用

InputStream is = new FileInputStream(filePath);
BufferedReader reader = new BufferedReader(new InputStreamReader(is,"UTF-8"));
reader.skip(n); // chars to skip
// .. and here you can start reading
于 2012-04-11T08:56:30.890 回答
0

您可以使用 BufferedInputStream 的 read(byte[] b, int off, int len)

这里 off 是偏移量(从你想开始阅读的地方开始)

http://docs.oracle.com/javase/7/docs/api/java/io/BufferedInputStream.html#read%28byte[],%20int,%20int%29

于 2012-04-11T09:40:31.350 回答