奇怪的请求,我知道,但我正在开发一个程序作为学习练习,它需要一个 .txt 文件,其中包含一堆指向网络上文本文件的 URL。然后它对每个文本中的每个单词进行哈希处理,并允许用户进行搜索。
我正在构建程序两次,一次没有并发,一次有。我刚刚完成了 sans-concurrency 程序的散列部分,我的时间显示时间与原始文件中 URL 的数量呈线性关系。
不过,该过程中最慢的部分实际上是从 Web 检索 URL。目前我正在这样做
URL url = new URL(revURL);
Scanner revScanner = new Scanner(url.openStream());
其中 revURL 是从 main 传递给方法的字符串。有没有更快的方法来检索这些文件,或者在不中断并发的情况下,这是否会尽可能快?