我一直在尝试根据一些日志文件(约 5000 万条记录,并且可以增长十倍)来制作一些报告 - 我已将其加载到表中并进行必要的更改(删除重复数据等) - 的表应该包含每种类型和每天每种产品的请求数,因此我试图将其缩减为仅具有表示请求数的计数列的不同产品
这是包含日志数据的原始表:
*************************** 1. row ***************************
Table: cdnlog2
Create Table: CREATE TABLE `cdnlog2` (
`serial` int(32) DEFAULT NULL,
`ip` varchar(100) DEFAULT NULL,
`country` varchar(100) DEFAULT NULL,
`productid` int(11) DEFAULT NULL,
`type` varchar(100) DEFAULT NULL,
`query_date` date DEFAULT NULL,
KEY `aaa` (`country`),
KEY `ccc` (`productid`),
KEY `type` (`type`),
KEY `date_index` (`query_date`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1
目的地表:
*************************** 1. row ***************************
Table: cdnlogfinal
Create Table: CREATE TABLE `cdnlogfinal` (
`country` varchar(100) DEFAULT NULL,
`productid` int(11) DEFAULT NULL,
`type` varchar(100) DEFAULT NULL,
`request_count` int(11) DEFAULT NULL,
`query_date` date DEFAULT NULL,
KEY `aaa` (`country`),
KEY `ccc` (`productid`),
KEY `type` (`type`),
KEY `date_index` (`query_date`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1
我现在试图将记录数减少为仅具有不同行及其计数的分组值(日志可以包含重复,因为可以在同一天多次选择相同的产品),但是,插入到辅助表已经运行了几个小时,状态为“正在复制到磁盘上的 tmp 表”-我已更改临时目录以留出足够的空间-任何指针?
提前致谢