在问我的问题(基本上就是标题所说的)之前,我想提供一些背景知识,以便更好地了解我的情况。
我正在用 Java 编写一个小应用程序,主要用于学术目的,但也考虑到了一项非常具体的任务。此应用程序所做的基本上是从基本 URL 开始构建 URL 层次结构,然后提供组织链接并对它们执行一些操作的能力。
想象以下 URL:
http://www.example.com
http://www.example.com/sub001
http://www.example.com/sub002
http://www.example.com/sub002/ultrasub
我希望我的程序在提供基本 URL http://www.example.com
(或http://www.example.com/
)时检索此层次结构。
在我的代码中,我有一个能够对 URL 进行编码的类,并且我已经想到了一种验证它们的方法,我只是找不到一种方法来找出基本 URL 下的 URL 层次结构。
有没有直接的方法,或者我只需要从基本 URL 下载文件并开始从文件中存在的相对和绝对链接构建层次结构?
我不是要求特定的代码,只是(有点)完整地解释我可以采取什么方式,也许有一些框架代码来指导我。
此外,我将 URL 存储在一个TreeMap<URL,Boolean>
结构中,其中Boolean
表明 URL 是否已被分析。在快速浏览了 Java 7 API 规范后,我选择了这种结构,但是您有没有建议更适合这个特定目的的结构?
提前致谢 :)