相关代码;关于实例化的barfs SAXSource
:
TransformerFactory factory = TransformerFactory.newInstance();
XMLReader xmlReader = XMLReaderFactory.createXMLReader("org.ccil.cowan.tagsoup.Parser");
Source input = new SAXSource(xmlReader, "http://books.toscrape.com/");
Result output = new StreamResult(System.out);
factory.newTransformer().transform(input, output);
JavaDoc说:
public SAXSource(XMLReader reader,
InputSource inputSource)
使用 XMLReader 和 SAX InputSource 创建一个 SAXSource。Transformer 或 SAXTransformerFactory 会将自己设置为阅读器的 ContentHandler,然后调用 reader.parse(inputSource)。
看InputSource
节目:
InputSource(InputStream byteStream)
Create a new input source with a byte stream.
InputSource(Reader characterStream)
Create a new input source with a character stream.
因此,例如html
,这将需要一个字符流来读取InputStream
??
会tagsoup
更好地用于这种身份转换吗?但是,怎么做?