在 html 页面中有一个类似下面的 javascript,我想提取 var 编号的值。
<script type="text/javascript">
var number= 4443;
</script>
我正在使用 jsoup 使用此命令解析 html 页面。
org.jsoup.nodes.Document doc3 = Jsoup.connect("http://htmlpage.com").get();
我该怎么做 ?谢谢大家。
在 html 页面中有一个类似下面的 javascript,我想提取 var 编号的值。
<script type="text/javascript">
var number= 4443;
</script>
我正在使用 jsoup 使用此命令解析 html 页面。
org.jsoup.nodes.Document doc3 = Jsoup.connect("http://htmlpage.com").get();
我该怎么做 ?谢谢大家。
Jsoup 是一个 HTML 解析器,而不是一个 JS 解析器。使用 Jsoup 可以获得的最好的东西是获取 HTML<script>
元素。
Elements scripts = doc3.select("script");
然后,它的内容必须被提取为文本并由Element#text()
能够解析 JS 代码的不同库(例如 Mozilla Rhino)进一步解析。当然,您也可以使用 , 等方法执行简单的解析,String
甚至可以使用一些好的正则表达式。indexOf()
substring()