java - 如何仅从 HTML 页面解析所需的表格并使用 JAVA 将结果导出到 .CSV 文件？

Question

我的文件夹中有一个 .html 页面。它有 38 个表，里面有不同的行。我的要求是，使用 java 程序，我只能选择表 1、12、36、37 并读取它们的数据。然后使用该结果数据，我需要生成一个 .csv 文件。可能吗？任何特定的图书馆？我已经用谷歌搜索了，但我只得到一个表格解析。提前致谢。

score 0 · Accepted Answer

使用jSoup解析 HTML 并提取所需数据。然后写入 CSV 格式，这在没有任何库的情况下相当容易，但您可以查看OpenCSV或Commons CSV。

score 0 · Accepted Answer

有多种 HTML 解析器可以为您提供帮助，其中大多数是开源的。

例如，您可以使用这个：HTML Parser，我已经在几个项目中使用了它，效果很好。这个想法是您解析您的 HTML，您可以通过 ID 或 HTML 标记（表格）提取您正在寻找的内容。

score 0 · Accepted Answer

您可以使用 Java XPath 库来查询 xml 和 html 等文档。在 XPath 中，您可以根据某些谓词获取 XML 文档的子集。看看：Java XPath 教程和XPath 教程

3 回答 3