1

此代码在 Blackberry JDE v4.2.1 上运行。它采用一种方法,可以进行返回 XML 的 Web API 调用。有时,返回的 XML 格式不正确,我需要在解析之前去除所有无效字符。

目前,我得到:org.xml.sax.SAXParseException: Invalid character '' encountered.

我希望看到一种在输入流上附加无效字符剥离器的快速方法的想法,以便流只流经验证器/剥离器并进入解析调用。即我试图避免保存流的内容。

现有代码:

handlerDefaultHandler
url的覆盖是一个包含 API 的字符串URL

hconn = (HttpConnection) Connector.open(url,Connector.READ_WRITE,true);

...

try{
   XMLParser parser = new XMLParser();
   InputStream input = hconn.openInputStream();
   parser.parse(input, handler);
   input.close();
} catch (SAXException e) {
   Logger.getInstance().error("getViaHTTP() - SAXException - "+e.toString());
}
4

2 回答 2

2

很难在 InputStream 上附加剥离器,因为流是面向字节的。在Reader上执行此操作可能更有意义。您可以制作类似于 StripReader 的东西,它包装另一个阅读器并处理错误。下面是一个快速的、未经测试的概念证明:

public class StripReader extends Reader
{
    private Reader in;
    public StripReader(Reader in)
    {
    this.in = in;
    }

    public boolean markSupported()
    {
    return false;
    }

    public void mark(int readLimit)
    {
    throw new UnsupportedOperationException("Mark not supported");
    }

    public void reset()
    {
    throw new UnsupportedOperationException("Reset not supported");
    }

    public int read() throws IOException
    {
    int next;
    do
    {
        next = in.read();
    } while(!(next == -1 || Character.isValidCodePoint(next)));

    return next; 
    }

    public void close() throws IOException
    {
    in.close();
    }

    public int read(char[] cbuf, int off, int len) throws IOException
    {
    int i, next = 0;
    for(i = 0; i < len; i++)
    {
        next = read();
        if(next == -1)
        break;
        cbuf[off + i] = (char)next;
    }
    if(i == 0 && next == -1)
        return -1;
    else
        return i;
    }

    public int read(char[] cbuf) throws IOException
    {
    return read(cbuf, 0, cbuf.length);
    }
}

然后,您将从 Reader 构造一个InputSource,然后使用 InputSource 进行解析。

于 2009-05-10T03:48:08.650 回答
0

使用FilterInputStream。覆盖FilterInputStream#read以过滤违规字节。

于 2009-05-10T03:27:59.400 回答