我正在使用 Jsoup 库来读取 URL。此网址在几个<script>
标签中包含文本。我可以获取每个<script>
标签中的文本吗?请注意,我不是要求解析 Javascript 文件,因为我已经知道 JSoup 不允许这样做。URL 的实际源代码在脚本标记中包含文本,我需要它。
doc = Jsoup.connect("http://www.example.com").timeout(10000).get();
Element div = doc.select("script").first();
for (Element element : div.children()) {
System.out.println(element.toString());
}
这是源代码中脚本标签之一的样子:
<script type="text/javascript">
(function() {
...
})();
</script>