我们正在尝试识别存储在我们企业中的某些信息的位置,以使其符合我们的数据政策。在文件端,我们使用 Nessus 搜索不同的文件,但我想知道在数据库端。
使用 Nessus 似乎在很大程度上毫无意义,因为它会输出原始数据并且不会告诉我们它在哪个表或行中,或者给我们很多有用的信息,特别是考虑到这些数据库非常大(数百 GB)。
另外值得注意的是,这个系统需要能够进行基于模式的匹配(例如使用正则表达式)。不仅仅是一个“愚蠢的搜索”引擎。
我已经调查了使用数据挖掘和数据仓库来查找这些数据,但似乎它们更多的是用于分析数据,而不仅仅是查找数据。
有没有更好的方法来搜索数据库中的大量数据以尝试找到这些信息?我们同时使用 Oracle 11g 和 SQL Server 2008 并且需要在两者上执行搜索,所以我想远离特定于服务器的范例(尽管如果我必须重写一些代码以从 T-SQL 转换为 PL /SQL,反之亦然,我不介意)