1

我有一个复合键表 CUSTOMER_PRODUCT_XREF

__________________________________________________________________
|CUSTOMER_ID (PK NN VARCHAR(191)) | PRODUCT_ID(PK NN VARCHAR(191))|
-------------------------------------------------------------------

在我的批处理程序中,我需要选择 500 个更新的客户,并获取 CUSTOMER 购买的 PRODUCT_ID,以逗号分隔并更新我们的 SOLR 索引。在我的查询中,我选择了 500 个客户并对 CUSTOMER_PRODUCT_XREF 进行左连接

SELECT 
    customer.*, group_concat(xref.PRODUCT_ID separator ', ')
FROM
    CUSTOMER customer
LEFT JOIN CUSTOMER_PRODUCT_XREF xref ON customer.CUSTOMER_ID=xref.CUSTOMER_ID  
group by customer.CUSTOMER_ID 
LIMIT 500;

编辑:解释查询

id  select_type table   type    possible_keys   key      key_len    ref     rows    Extra
1   SIMPLE     customer ALL      PRIMARY        NULL     NULL       NULL    74236   Using where; Using temporary; Using filesort
1   SIMPLE      xref    index     NULL          PRIMARY  1532       NULL    121627  Using where; Using index; Using join buffer (Block Nested Loop)

运行上述查询 20 分钟后,我失去了连接异常。

我尝试了以下(子查询),需要 1.7 秒才能得到结果,但仍然很慢。

SELECT 
customer.*, (SELECT group_concat(PRODUCT_ID separator ', ') 
     FROM CUSTOMER_PRODUCT_XREF xref 
        WHERE customer.CUSTOMER_ID=xref.CUSTOMER_ID
        GROUP BY customer.CUSTOMER_ID) 
FROM
CUSTOMER customer
LIMIT 500;

编辑:解释查询产生

id  select_type          table      type    possible_keys   key    key_len  ref     rows   Extra
1   PRIMARY              customer     ALL       NULL        NULL    NULL    NULL    74236   NULL
2   DEPENDENT SUBQUERY    xref      index        NULL     PRIMARY   1532    NULL    121627 Using where; Using index; Using temporary; Using filesort

问题

CUSTOMER_PRODUCT_XREF 已经将两列都设置为 PRIMARY_KEY 和 NOT_NULL 但为什么我的查询仍然很慢?我认为在列上有主键就足以为其建立索引。我需要进一步索引吗?

数据库信息:

  • 我数据库中的所有 ID 都是 VARCHAR(191),因为 ID 可以包含字母。
  • 我正在使用 utf8mb4_unicode_ci 字符编码
  • 我正在使用 SET group_concat_max_len := @@max_allowed_pa​​cket 来获取每个客户的最大 product_id 数量。更喜欢在一个主查询中使用 group_concat,这样我就不必执行多个单独的查询来为每个客户获取产品。
4

2 回答 2

0

您的原始查询版本是join先执行然后对所有结果数据进行排序——考虑到字段的大小,这可能非常大。

您可以通过先选择 50000 名客户然后加入来“修复”该版本:

SELECT c.*, group_concat(xref.PRODUCT_ID separator ', ')
FROM (select c.*
      from CUSTOMER customer c
      order by c.customer_id
      limit 500
     ) c LEFT JOIN
     CUSTOMER_PRODUCT_XREF xref
     ON c.CUSTOMER_ID=xref.CUSTOMER_ID  
group by c.CUSTOMER_ID ;

另一种可能会或可能不会产生重大影响的替代方法是在子查询中按客户进行聚合并加入,如下所示:

SELECT c.*, xref.products
FROM (select c.*
      from CUSTOMER customer c
      order by c.customer_id
      limit 500
     ) c LEFT JOIN
     (select customer_id, group_concat(xref.PRODUCT_ID separator ', ') as products
      from CUSTOMER_PRODUCT_XREF xref
     ) xref
     ON c.CUSTOMER_ID=xref.CUSTOMER_ID;

您发现 MySQL 优化器无法识别这种情况(限制对性能有很大影响)。在这种情况下,其他一些数据库引擎在优化方面做得更好。

于 2013-07-07T11:45:34.380 回答
0

好吧,当我在 CUSTOMER_PRODUCT_XREF 表中的 CUSTOMER_ID 上创建索引时,我的问题中的查询速度加快了。

所以我现在在 PRODUCT_ID 上有两个索引 PRIMARY_KEY_INDEX 和 CUSTOMER_ID CUSTOMER_ID_INDEX 在 CUSTOMER_ID

于 2013-07-07T12:56:24.720 回答