在开始之前,我想对我在 stackoverflow 上获得的所有见解以及所有做出贡献的人表示感谢。我有一个关于管理大量文件的一般性问题。我正在尝试确定我的选择,如果有的话。就这样吧。
目前,我有大量文件,而且我在 Windows 7 上。我一直在做的是通过根据需要一起处理的内容将它们复制到文件夹中来对文件进行分类。因此,我有一组按日期包含文件(用于长期存储),另一组按类别包含副本(用于处理和计算)。当然,这每次都会使我的数据翻倍。现在我必须创建一组以上的类别;准确地说是3份。这使我的数据翻了两番。
对于事物的处理方面,数据最终以excel形式出现。最初,所有的数据都被带到了excel中。然后在excel中执行所有组织和过滤。从长远来看,这是耗时且不易维护的。后来工作量转移到文件系统本身,这减轻了excel的工作量。
总而言之,这是对磁盘空间的极其低效的使用。有什么更好的方法来处理这个?
想到的事情:
- 重叠文件夹
- 有没有办法创建一个只保存文件地址的文件夹,而不是复制文件。这样我可以让两个文件夹引用同一个文件。
- 据我了解,文件夹是一个文件,其中列出了其中文件的内存地址,但在 Windows 上,一个文件只能包含在一个文件夹中。
- 微软 SQL 服务器
- 不确定这里可以做什么。
- 符号链接
- 我不是管理员,所以无法执行 mklink 命令。
- 此外,我不确定与此相关的任何性能问题。
- 一个路口
- 显然不允许单个文件,只有 Windows 中的文件夹。
- 搜索文件夹 (*.search-ms)
- 也许我遗漏了一些东西,但据我所知,没有办法指定要列出的单个文件。
- 散列文件
- 为所有文件创建哈希标签,将允许文件存储一次。但是后来我不知道如何处理哈希标签。
- XML
- 也许我可以使用 xml 文件将元数据附加到文件并以某种方式使用它们进行搜索。
- 数据库文件系统
- 我最近在搜索中遇到了这个概念。不确定它将如何应用 Windows。