我是一名开发人员,在管理具有大量记录的表时遇到问题。
我正在执行一个 cron 作业来填充具有 5-6 列和大约 4,00,000 到 5,00,000 行的主表(表 A)中的数据,然后创建另一个表,并且该表中的数据将随着时间的推移而继续增加.
表 A 包含原始数据,我的输出表是表 B
我的 cron 脚本截断表 B 中的数据,然后使用选择查询插入数据
TRUNCATE TABLE_B;
INSERT INTO TABLE_B (field1, field2)
SELECT DISTINCT(t1.field2), t2.field2
FROM TABLE_A AS t1
INNER JOIN TABLE_A t2 ON t2.field1=t1.field1
WHERE t1.field2 <> t2.field2
GROUP BY t1.field2, t2.field2
ORDER BY COUNT(t1.field2) DESC;
以上选择查询产生大约 1,50,000 到 2,00,000 行
现在填充表 B 需要花费太多时间,同时如果我的应用程序尝试访问表 B 则选择查询失败
解释查询结果如下:
'1','PRIMARY','T1','ALL','field1_index',NULL,NULL,NULL,'431743','Using temporary;Using filesort'
'1','PRIMARY','T2','ref','field1_index','field1_index','767','DBNAME.T1.field1','1','Using where'
有人可以帮我改进这个过程,或者指导我上述过程的替代方案吗?
谢谢
苏克图