0

我的文件夹中有一个 .html 页面。它有 38 个表,里面有不同的行。我的要求是,使用 java 程序,我只能选择表 1、12、36、37 并读取它们的数据。然后使用该结果数据,我需要生成一个 .csv 文件。可能吗?任何特定的图书馆?我已经用谷歌搜索了,但我只得到一个表格解析。提前致谢。

4

3 回答 3

0

使用jSoup解析 HTML 并提取所需数据。然后写入 CSV 格式,这在没有任何库的情况下相当容易,但您可以查看OpenCSVCommons CSV

于 2013-06-19T07:46:55.467 回答
0

有多种 HTML 解析器可以为您提供帮助,其中大多数是开源的。

例如,您可以使用这个:HTML Parser,我已经在几个项目中使用了它,效果很好。这个想法是您解析您的 HTML,您可以通过 ID 或 HTML 标记(表格)提取您正在寻找的内容。

于 2013-06-19T07:47:12.207 回答
0

您可以使用 Java XPath 库来查询 xml 和 html 等文档。在 XPath 中,您可以根据某些谓词获取 XML 文档的子集。看看:Java XPath 教程XPath 教程

于 2013-06-19T07:49:41.397 回答