4

对于提供的记录集(约 5000 条记录),以下 MySql 更新状态似乎花费了过多的时间来执行。下面的更新语句平均需要 12 秒才能执行。我目前计划对 5 个不同的时期和大约 500 个不同的股票代码运行此计算。这转化为 12 秒 * 5 次计算 * 500 个符号 = 30,000 秒或 8..33 小时。

更新声明:

UPDATE tblStockDataMovingAverages_AAPL JOIN 
(SELECT t1.Sequence,
   (
    SELECT AVG(t2.Close)
        FROM tblStockDataMovingAverages_AAPL AS t2
        WHERE (t1.Sequence - t2.Sequence)BETWEEN 0 AND 7
    )AS "8SMA" 
FROM tblStockDataMovingAverages_AAPL AS t1 
ORDER BY t1.Sequence) AS ma_query 
ON tblStockDataMovingAverages_AAPL.Sequence = ma_query.Sequence  
SET tblStockDataMovingAverages_AAPL.8MA_Price = ma_query.8SMA

表设计:

CREATE TABLE `tblStockDataMovingAverages_AAPL` (
  `Symbol` char(6) NOT NULL DEFAULT '',
  `TradeDate` date NOT NULL DEFAULT '0000-00-00',
  `Sequence` int(11) DEFAULT NULL,
  `Close` decimal(18,5) DEFAULT NULL,
  `200MA_Price` decimal(18,5) DEFAULT NULL,
  `100MA_Price` decimal(18,5) DEFAULT NULL,
  `50MA_Price` decimal(18,5) DEFAULT NULL,
  `20MA_Price` decimal(18,5) DEFAULT NULL,
  `8MA_Price` decimal(18,5) DEFAULT NULL,
  `50_200_Cross` int(5) DEFAULT NULL,
  PRIMARY KEY (`Symbol`,`Sequence`),
  KEY `idxSequnce` (`Sequence`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1$$

任何有关加快进程的帮助将不胜感激。

选择解释的输出:

id  select_type         table   type    possible_keys   key                 key_len ref     rows    Extra
1   PRIMARY             t1      index   NULL            idxSymbol_Sequnce   11      NULL    5205    Using index; Using filesort
2   DEPENDENT SUBQUERY  t2      ALL     NULL            NULL                NULL    NULL    5271    Using where
4

2 回答 2

1

Close您可以通过向字段添加索引来稍微优化它。AVG功能必须更有效。请分享您的数据集转储以更接近地查看它。

于 2012-12-08T19:48:51.707 回答
1

这应该会好一点:

update tblStockDataMovingAverages_AAPL
join (
  select t1.sequence as sequence, avg(t2.close) as av
  from tblStockDataMovingAverages_AAPL t1
  join tblStockDataMovingAverages_AAPL t2
  on t2.sequence BETWEEN t1.sequence-7 AND t1.sequence
  group by t1.sequence
) t1 on tblStockDataMovingAverages_AAPL.sequence = t1.sequence
set 8MA_Price = t1.av

关于我的陈述BETWEENfield1 OPERATOR expression(field2)比条件更容易优化。我认为这适用于.expression(field1, field2) OPERATOR expressionONBETWEEN

看起来ORDER BY您的查询中的 是不必要的,删除它可能会加快您的查询速度。

如果任何股票代码出现在同一个表中,将所有这些都放入一个更新查询中(尽管不同的时期不起作用),这可能比为每个都运行它要快得多。

正如已经建议的那样,添加索引Close可能会有所帮助。

于 2013-01-09T17:21:28.527 回答