我希望将Java SE 7 文档从 HTML 导出为可解析的 XML。
无论是使用 Perl 之类的脚本语言完成,还是直接从 Java 完成(可能使用 Eclipse),我都愿意接受建议。也许有人已经这样做了?
我需要 API 的 Javadoc 中可用的大部分数据,因此手动完成需要很长时间。我不是在寻找代码,我自己可以弄清楚,我只是在寻找一些关于这样做的想法,因为我确信有一个“简单”的方法,我不想浪费太多时间以一种方式做,后来发现我可以用另一种方式更快地做到这一点。
没关系,但我将使用 C# 读取 XML。
我知道这是一个有点奇怪的问题,但我不知道还能问哪里。