1

我需要将表格数据导入我的数据库。数据通过多方的电子表格(主要是 Excel 文件)提供。这些文件中的每一个的格式都相似但不相同,并且需要进行各种转换才能将数据按摩成适合导入的最终格式。此外,输入格式将来可能会发生变化。我正在寻找一种可以由普通用户运行和管理的工具来转换输入文件。

现在让我列出一些我想做的转换:

  • 交换列:

输入是:

|Name|Category|Price|
|data|data    |data |

输出是

|Name|Price|Category|
|data|data |data    |
  • 重命名列

输入是:

|PRODUCTNAME|CAT |PRICE|
|data       |data|data |

输出是

|Name|Category|Price|
|data|data    |data |
  • 根据查找表映射列,如上面的示例:在列 Category 中将字符串“Car”的每次出现替换为“automobile”
  • 基本数学:将价格列乘以某个因子
  • 基本字符串操作 假设价格列的格式是“3 x $45”,我想将其拆分为金额和价格两列
  • 按值过滤行:排除所有包含“昂贵”一词的行
  • 等等

我有以下要求:

  • 它可以在以下任何平台上运行:Windows、Mac、Linux
  • 开源、免费软件、共享软件或商业软件
  • 转换需要通过 GUI 进行编辑
  • 如果该工具需要最终用户培训才能使用,这不是问题
  • 它可以处理大约 1000-50000 行

基本上,我正在寻找一种图形工具,可以帮助用户规范化数据,以便可以导入,而无需编写一堆适配器。

你用什么工具来解决这个问题?

4

4 回答 4

2

恕我直言,最简单的解决方案是使用 Excel 本身 - 您将免费获得所有 Excel 内置函数和宏。

将您的转换代码放在通过电子表格上的 Excel 控件(用于 GUI 方面)调用的宏中。想办法将电子表格和宏插入客户的 Excel 文件中。这样您就不必担心平台兼容性(这是他们的文件,因此他们必须能够打开它)以及其他所有问题。其他要求也满足。唯一的培训是向他们展示如何启用宏。

于 2009-09-17T14:05:22.320 回答
0

Mule Data Integrator 将从 csv 文件中完成所有这些工作。因此,您可以将电子表格导出为 CSV 文件,并将 CSV 文件加载到 MDI。它甚至可以将数据直接加载到数据库中。用户可以指定您请求的所有转换。MDI 将在非 Mule 环境中正常工作。您可以在mulesoft.com找到它 (免责声明,我公司开发了该产品所基于的转换技术)。

于 2009-12-06T19:58:55.547 回答
0

你没有说你要导入哪个数据库,或者你使用什么工具。如果您使用的是 SQL Server,那么我建议您在导入过程中使用 SQL Server Integration Services (SSIS) 来操作电子表格。

于 2009-12-06T20:01:33.407 回答
0

我倾向于使用 MS Access 作为多个数据源和目标之间的管道 - 但您正在寻找更自动化的东西。您可以在 Access 中使用宏和 VB 脚本来帮助完成许多基础知识。

但是,您总是会遇到数据一致性问题,因为用户会误解如何规范化他们的信息。祝你好运!

于 2009-12-10T04:47:36.563 回答