我有一个使用 Javascript 创建表格的网页。现在我在我的 Java 项目中使用 JSoup 来解析网页。顺便说一句,JSoup 无法运行 Javascript,因此无法生成表格并且网页的来源不完整。如何包含该脚本创建的 HTML 代码以便使用 JSoup 解析其内容?你能提供一个简单的例子吗?谢谢!
网页示例:
<!doctype html>
<html>
<head>
<title>A blank HTML5 page</title>
<meta charset="utf-8" />
</head>
<body>
<script>
var table = document.createElement("table");
var tr = document.createElement("tr");
table.appendChild(tr);
document.body.appendChild(table);
</script>
<p>First paragraph</p>
</body>
</html>
输出应该是:
<!DOCTYPE html>
<html>
<head>
<title>
A blank HTML5 page
</title>
<meta charset="utf-8"></meta>
</head>
<body>
<script>
var table = document.createElement("table");
var tr = document.createElement("tr");
table.appendChild(tr);
document.body.appendChild(table);
</script>
<table>
<tr></tr>
</table>
<p>
First paragraph
</p>
</body>
</html>
顺便说一句,JSoup 不包含 table 标记,因为它无法执行 Javascript。我怎样才能做到这一点?