寻找有关文件系统管理工具的建议。我们有数 TB 的图像、pdf、excel 表格等。
我们正在寻找某种软件来帮助我们管理、存档等图像。
我们不会将所有文件信息存储在数据库中,但有些是,我们希望找到一个可以帮助我们将存档过程集成到数据库中的应用程序。
谢谢!
我总是在贸易杂志上看到这些家伙。 http://www.dtsearch.com/ 我相信他们早在谷歌之前就已经存在了。不确定这是否是您要查找的内容。
如果某些数据保存在磁盘上,则搜索应用程序可能更合适。您可以使用谷歌、微软搜索或类似程序。
一些数据库产品(例如,Oracle)提供了类似文件系统的存储,您可以将文件放入其中。由于它是 Oracle 管理的文件系统,因此您拥有所有 Oracle 备份和管理工具。由于它是一个文件系统,您只需使用普通的操作系统工具,例如cp
将文件移入和移出。
最佳实践是避免将 RDBMS 浪费在 RDMBS 无法使用的大型 BLOBS 数据上。将数据库用于名称、日期和它处理得很好的东西。实际的图像文件或电子表格文件可以留在普通的文件系统世界中。如果您这样做,您不会付出太多努力或复杂性 - 您只是在收集有关文件的基本信息。
您不会重复存储(电子表格只是一个普通文件)。您不要将无法由数据库处理的大型对象放入数据库中。
文件系统比数据库更快、更简单、更可靠。随意将其用于大容量存储。该数据库具有很酷的搜索功能。为此使用数据库。
为了澄清,我想我应该说所有文件都在文件服务器上,但是在数据库中有对其中一些的引用(上传日志等)所以我们只是希望也许有一些工具可以让我们设置它,这样如果它将文件存档在某个目录中,它可以运行某种 sql 命令,以便更新数据库以知道文件已存档。
但感谢您的信息。我认为在这种情况下我们将不得不自己动手。
您可以定期运行作业以列出自上次运行作业以来已添加到文件系统的文件。在 Windows 上,此批处理文件将列出其中的所有文件和文件夹,archivedirectory
以便您可以将该列表与上次运行的时间进行比较。
cd archivedirectory
del oldlist.txt
rename newlist.txt oldlist.txt
dir /s /b > newlist.txt
如果您在 Windows 上安装 diffutils,则可以使用标准diff
工具列出新文件。要隔离新文件:
diff oldlist.txt newlist.txt > newfiles.txt
任何以newfiles.txt
开头的行>
现在都应该为您提供新文件。(您可以使用grep
并sed
进一步精简它。Windows 版本可从gnuwin32获得)您现在应该能够对该文件运行进一步的操作,可能使用 Python、C# 或 Java 等语言,以将信息添加到数据库。
我必须将您指向Total Commander。这是一个两窗格的文件管理器,它使几乎所有的文件任务变得简单快捷。你使用它的次数越多,你使用它的速度就越快。
这类程序已经存在了很长时间。从 Norton Commander 时代到 Unix/Linux 系统上的 Midnight Commander。它们非常高效,相比之下,在 Windows 资源管理器中完成的大多数操作显得笨拙和缓慢。