0

arXiv 电子打印档案包含来自各个科学领域的数 TB 论文。一些用户希望在自己的计算机上保留这些数据的完整副本,而另一些用户只想下载特定类别中的最新论文。他们正在寻求使用某种分布式下载系统(例如 BitTorrent)来减少带宽负载。我正在寻找涵盖所有这些的程序或一组程序的想法。

4

3 回答 3

1

arXiv正是为此目的推荐 squid 在 httpd 加速器模式下。这还不够好有什么特别的原因吗?

于 2009-07-30T13:52:28.637 回答
1

完整的 pdf 内容在亚马逊云中。

虽然 arXiv 上有 > 600k 篇论文,但 pdf 的总大小为 < 1/2 TB

http://arxiv.org/help/bulk_data_s3

T。

于 2010-08-22T22:49:16.177 回答
0

我的第一个想法是,这看起来很像 Usenet 新闻组,服务器上的消息具有无限的持久性。不过,我不知道它与 PDF 的效果如何。

于 2009-07-30T12:34:17.050 回答