我需要将表格数据导入我的数据库。数据通过多方的电子表格(主要是 Excel 文件)提供。这些文件中的每一个的格式都相似但不相同,并且需要进行各种转换才能将数据按摩成适合导入的最终格式。此外,输入格式将来可能会发生变化。我正在寻找一种可以由普通用户运行和管理的工具来转换输入文件。
现在让我列出一些我想做的转换:
- 交换列:
输入是:
|Name|Category|Price|
|data|data |data |
输出是
|Name|Price|Category|
|data|data |data |
- 重命名列
输入是:
|PRODUCTNAME|CAT |PRICE|
|data |data|data |
输出是
|Name|Category|Price|
|data|data |data |
- 根据查找表映射列,如上面的示例:在列 Category 中将字符串“Car”的每次出现替换为“automobile”
- 基本数学:将价格列乘以某个因子
- 基本字符串操作 假设价格列的格式是“3 x $45”,我想将其拆分为金额和价格两列
- 按值过滤行:排除所有包含“昂贵”一词的行
- 等等
我有以下要求:
- 它可以在以下任何平台上运行:Windows、Mac、Linux
- 开源、免费软件、共享软件或商业软件
- 转换需要通过 GUI 进行编辑
- 如果该工具需要最终用户培训才能使用,这不是问题
- 它可以处理大约 1000-50000 行
基本上,我正在寻找一种图形工具,可以帮助用户规范化数据,以便可以导入,而无需编写一堆适配器。
你用什么工具来解决这个问题?