我们最近将 Magento 应用程序从私有主机迁移到 AWS Web 服务。我们注意到 Magento 的一些内部功能在迁移后执行的时间过长,因此开始调查。
有问题的查询之一是一个简单的客户选择查询,大约有 9-10 个常规连接到属性表以获取属性。
我们对查询进行了一些测试,发现旧主机和 AWS 之间的区别在于,在旧主机上,MySQL 优化器似乎使用了正确的索引,而在 AWS 中它求助于使用文件排序,而忽略了索引。
UsingFORCE INDEX(index_name)
使查询在 AWS 中正确执行,但是我们不想走这条路,宁愿修复数据库配置中的问题,也不愿在整个 Magento 应用程序中进行手动破解。需要明确的是,这不是我们的索引的问题,它们设置正确。
背景:
- 我已将旧主机的 my.cnf 文件中的所有 MySQL 参数复制到 RDS 中的参数组,但没有任何区别
- 这些表都是 InnoDB
- 我已经运行了分析、修复和优化查询等
- 在 RDS 上完成查询大约需要 45 秒
- 查询在旧主机上完成大约需要 2 秒,或者当我使用
FORCE INDEX()
强制 RDS 以与旧主机相同的方式运行时
旧的 MySQL 服务器运行的是5.1.61版本,而我们运行的 AWS RDS 实例是5.6.19。一个咨询小组向我们建议我们将 RDS 实例降级到 5.1.61,但是我们再次不想这样做,因为它不是一个可持续的解决方案。
有问题的查询如下(为了空间,通过从选择中删除字段来缩短):
SELECT
`e`.*
-- various field names here, removed
FROM `customer_entity` AS `e`
LEFT JOIN `customer_entity_int` AS `at_default_billing` ON (`at_default_billing`.`entity_id` = `e`.`entity_id`) AND (`at_default_billing`.`attribute_id` = '13')
LEFT JOIN `customer_address_entity_varchar` AS `at_billing_postcode` ON (`at_billing_postcode`.`entity_id` = `at_default_billing`.`value`) AND (`at_billing_postcode`.`attribute_id` = '30')
LEFT JOIN `customer_address_entity_varchar` AS `at_billing_city` ON (`at_billing_city`.`entity_id` = `at_default_billing`.`value`) AND (`at_billing_city`.`attribute_id` = '26')
LEFT JOIN `customer_address_entity_varchar` AS `at_billing_telephone` ON (`at_billing_telephone`.`entity_id` = `at_default_billing`.`value`) AND (`at_billing_telephone`.`attribute_id` = '31')
LEFT JOIN `customer_address_entity_varchar` AS `at_billing_regione` ON (`at_billing_regione`.`entity_id` = `at_default_billing`.`value`) AND (`at_billing_regione`.`attribute_id` = '28')
LEFT JOIN `customer_address_entity_varchar` AS `at_billing_country_id` ON (`at_billing_country_id`.`entity_id` = `at_default_billing`.`value`) AND (`at_billing_country_id`.`attribute_id` = '27')
LEFT JOIN `core_store` AS `at_store_name` ON (at_store_name.`store_id`=e.store_id)
LEFT JOIN `customer_entity_varchar` AS `firstname` ON e.entity_id = firstname.entity_id AND firstname.attribute_id = 5
LEFT JOIN `customer_entity_varchar` AS `lastname` ON e.entity_id = lastname.entity_id AND lastname.attribute_id = 7
WHERE (`e`.`entity_type_id` = '1')
ORDER BY `e`.`entity_id`
DESC LIMIT 20;
EXPLAIN
执行此查询时服务器之间的差异摘要如下:
RDS - MySQL v5.6.19:
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: e
type: ref
possible_keys: IDX_CUSTOMER_ENTITY_ENTITY_TYPE_ID
key: IDX_CUSTOMER_ENTITY_ENTITY_TYPE_ID
key_len: 2
ref: const
rows: 653990
Extra: Using temporary; Using filesort
旧主机 - MySQL v5.1.61,或FORCE INDEX
在 RDS 上使用时:
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: e
type: ref
possible_keys: IDX_CUSTOMER_ENTITY_ENTITY_TYPE_ID
key: IDX_CUSTOMER_ENTITY_ENTITY_TYPE_ID
key_len: 2
ref: const
rows: 644775
Extra: Using where
我知道这些数据库版本的差异很可能改变了查询优化器的工作方式,我不知道这些版本的差异是什么,但我正在寻找一种可以帮助的解决方案我们来解决这些差异。
编辑:这是我从旧主机复制的参数与此 MySQL 版本的默认参数的 RDS 比较列表。这些参数都没有影响上面的结果,无论它们是否存在,或者我是否在 RDS 中使用了标准参数: