我们在 Visual FoxPro 中有一堆实用程序脚本,我们用它们来交互式地清理/格式化数据。我们想开始迁移此代码以利用其他数据库平台,如 MySQL 或 SQLite。
例如,我们运行了一个脚本,它将名称和/或地址行转换为正确的大写/小写。此代码遍历整个表并分析/修复每一行。还有其他一些事情,比如解析和标准化地址,甚至重复检测......
我们正在考虑将代码迁移到 Python,并可能使用 SQLAlchemy 之类的东西作为“中间人”。
在 Visual FoxPro 中,数据库/表是集成的,因此我们可以打开表并运行命令。MySQL 的不同之处在于我们需要从中提取数据,然后处理提取的数据,然后更新表。
最好的方法是什么?
我看到了几种可能性:
1)提取要处理的整个数据集,比如所有地址字段,如果这是我们要处理的内容,然后将其全部更新并全部写回......
2)以块的形式提取数据集,以免潜在地消耗大量系统内存......然后更新并写回
3) 生成 SQL 代码,也许在 SQLAlchemy 之类的工具的帮助下,被发送到服务器并由服务器执行......
4)???还有什么我没有想到的吗?