2

我们有一个包含一些冗余、错误数据的数据库。例如,一些文章的名称有大写小写的区别,其他的有口音问题,还有一些缺少字母等等。这个想法是合并实际上相同的数据库记录。

是否有很好的工具可以轻松清理数据库,理想情况下这不会自动完成,但需要用户确认

4

1 回答 1

1

有很多用于数据清理的工具。还有更多的公司提供数据清理服务。

我已经为几家大公司执行过数据清理,这不是一件容易的事,或者看起来很简单,并且重复数据删除也充满了各种问题,这些问题在您开始练习之前不会变得明显。

恕我直言,如果您的遗留数据处于相对较差的状态,并且您在这个(非常专业的)领域没有内部专业知识,我会考虑聘请第三方为您执行此操作,因为他们可能会更快地执行它并且总成本低于从头开始。

如果您想培养内部技能来做到这一点,那么我已经进行了几次快速的谷歌搜索并看到了许多提供的软件包,您可能想了解这些针对特定类型的相对优势您要清理的数据,因为某些数据在某些领域会比其他数据更好。

希望这会有所帮助,奥利。

于 2011-08-15T09:54:48.350 回答