所以我想做的很简单。我正在解析脚本标签的 HTML 文档,使用 ParserDelegator,并使用 ParserCallback 吐出脚本标签。但是当我运行这个程序时,它什么也没做。回调永远不会被调用。我的 html 文件路径是正确的,它确实包含脚本标签。它的格式也正确。
import java.io.*;
import javax.swing.text.html.parser.ParserDelegator;
import javax.swing.text.html.HTMLEditorKit;
import javax.swing.text.html.HTML;
import javax.swing.text.SimpleAttributeSet;
import java.util.Enumeration;
public class JSFinder {
//static ParserDelegator pd;
public JSFinder () {
//pd = new ParserDelegator();
}
public static void main(String args[]) {
try {
HTMLEditorKit.ParserCallback callback = new ScriptTagCallBack();
new ParserDelegator().parse(new InputStreamReader(new FileInputStream(new File ("<path-to-html>"))), callback, false);
}
catch (Exception e) {
e.printStackTrace();
}
}
}
class ScriptTagCallBack extends HTMLEditorKit.ParserCallback {
public ScriptTagCallBack() {
super();
}
public void handleStartTag(HTML.Tag t, SimpleAttributeSet a, int pos) {
if(t == HTML.Tag.SCRIPT) {
System.out.println("Found a script tag");
System.out.println(a);
}
else {
System.out.println("Not a script tag");
}
}
public void handleEndTag(HTML.Tag t, SimpleAttributeSet a, int pos) {
if(t == HTML.Tag.SCRIPT) {
System.out.println("Found a script tag");
System.out.println(a);
}
else {
System.out.println("Not a script tag");
}
}
}
知道我做错了什么吗?我看过一些例子(比如这个:http ://www.java2s.com/Tutorial/Java/0320__Network/HTMLparserbasedonHTMLEditorKitParserCallback.htm )并且我在做基本相同的事情(除了我没有覆盖所有ParserCallback 的方法,我使用的是文件路径而不是 URL)。提前致谢。