我有一个关于设置表以处理我每天导入的大量数据的最佳方法的一般性问题。我将每天导入 10 个包含 1000 条记录的 csv 文件,以便此表快速扩展。
它由大约 15 列组成,范围从微型和中等整数到 30 个字符的 varchar。
没有 ID 字段 - 我可以连接 6 列来形成一个主键 - 这将是一个 var char 总长度约为 45。
导入后,我需要通过 Web 前端在摘要级别报告此数据,因此我看到自己必须在导入后从中构建报告表。
在此数据中,许多字段在每天导入时都会重复出现 - 日期、地区、客户等,每天只有一半的列是特定于记录的。
问题:
- 我是否应该立即将其全部导入到一张表中作为转储表。
- 我是否应该通过导入过程转换数据并将导入拆分到不同的表中
- 我是否应该根据我可以在导入期间获得唯一键的列形成一个 id 字段
- 我应该为此使用 auto inc id 字段吗?
- 这应该是什么类型的表 InnoDB 等
我担心这个表上的数据过载,这会使提取到报告表变得越来越困难?
建议真的很有帮助。谢谢。