我有一个基于文件的搜索引擎的应用程序 (Endeca)。客户拥有 Linux 100 服务器,全部连接到同一个 SAN(非常快,光纤通道)。目前,这 100 台服务器中的每台都使用相同的文件集。目前,每个服务器都有自己的索引副本(大约 4 个演出,因此总共 400 个演出)。
我想做的是拥有一个目录和该目录的 100 个虚拟副本。如果应用程序需要对该目录中的任何文件进行更改,则只有在那时才开始创建原始文件夹的不同副本。
所以我的想法是:所有 100 人都开始使用同一个目录(但他们每个人都认为他们有自己的副本,并且不知道更好)。随着变化的出现,Linux/SAN 可能会拥有多达 100 个原始副本(现在略有不同)。
这样的事情可能吗?
我正在研究这种方法的原因是减少文件传输时间和磁盘空间。我们只需将 4 gig 索引文件复制一次到 SAN 并创建虚拟副本。如果没有变化,我们只会使用 4 个演出而不是 400 个。
提前致谢!