1

我需要帮助来设置所有 MySQL 变量以及任何人可能有的任何建议。

我们目前有 1 台服务器:

  • 4 个双核 2.4 GHz
  • 32GB 内存
  • Windows Server 2008 网络版

MySQL设置为:

  • 1 台主服务器(端口 3301)
  • 4 个从站(端口 3302、3303、3304、3305)

复制是一种享受。从站的想法是处理许多连接

MySQL 配置文件如下所示:

[mysqld]  
datadir="E:\MySQL_Rep\data_3302"  
init-file="E:\MySQL_Rep\mysql-init-slave.txt"  
port=3302  
server-id=3302  
default-storage-engine=myisam  
bulk_insert_buffer_size = 512M  
join_buffer_size = 5M  
query_cache_limit = 1M  
max_connections=1510  
tmp_table_size = 18M  
skip-innodb  
low-priority-updates  
delay-key-write=ALL  
innodb_write_io_threads = 5  
innodb_read_io_threads = 10  
skip-ssl  
slave_compressed_protocol  
slave-skip-errors=all  
sync_binlog = 1  
join_buffer_size = 20M  
replicate-wild-ignore-table=db.search_result%  
key_buffer_size=4G  
expire_logs_days=1    
relay-log-space-limit=10G  
myisam-recover=backup,force  
read_rnd_buffer_size=1G  
read_buffer_size=1G  

以上 4 个从机中的每一个都是相同的,只是将“3302”更改为 3303、3304 和 3305。

我们有 3 个主表:

Name: keyword_index  
Engine: MyISAM  
Rows: 1,521,140  
Avg Row Length: 25  
Data Length: 38150952  
Index Length: 48757760  
Columns: id(INT 11), word(VARCHAR 45, UNIQUE)  

Name: keyword_prodid  
Engine: MyISAM  
Rows: 42,611,210  
Avg Row Length: 17  
Data Length: 724390570  
Index Length: 1796547584  
Columns: id_kw(BIGINT 20, INDEXED), id_prod(BIGINT 20)  

Name: products  
Engine: MyISAM  
Rows: 7,192,937  
Avg Row Length: 1018  
Data Length: 7544910024  
Index Length: 686807040  
Columns: prod_id(BIGINT 20),... ... ...  

我运行的查询:

SELECT kwi.id FROM keyword_index kwi WHERE kwi.`word` = 'mobile' LIMIT 1

解释:

'1', 'SIMPLE', 'kwi', 'const', 'word_UNIQUE', 'word_UNIQUE', '137', 'const', '1', ''`  

这显然在不到 0 秒的时间内运行,并返回5531;


使用上述结果

SELECT 
    id_prod,count(*) AS count,
    @sID 
FROM keyword_prodid kwp 
WHERE kwp.id_kw = 264012 
    OR kwp.id_kw = 817869 
    OR kwp.id_kw = 5531 
    OR kwp.id_kw = 7167 
    OR kwp.id_kw = 3462 
    OR kwp.id_kw = 811564 
GROUP BY id_prod 
ORDER BY count DESC LIMIT 10 INTO OUTFILE 'THEFILE'

解释:

'1', 'SIMPLE', 'kwp', 'range', 'PRIMARY,id_kw', 'PRIMARY', '8', NULL, '55071', 'Using where; Using index; Using temporary; Using filesort'`  

这将在30 到 60 秒内运行,这就是我遇到问题的地方。该查询返回一个产品 ID 列表,其中包含关键字最多的产品首先出现在列表中。

然后,我使用从上面生成的列表从产品表中获取具有上述 ID 的产品。

我的问题是,有没有办法让这个查询运行得更快,通过优化查询或调整配置文件设置。所有的设置几乎都是猜测的,在这个阶段我们只能在一台物理服务器上运行它。

如果您需要更多信息,请告诉我。

4

1 回答 1

1

您需要创建复合索引id_kw + id_prod

重要提示:只要id_kw + id_prod索引包含id_kw在其左侧 - 您不再需要单个id_kw索引,所以删除它。

还有这个

kwp.id_kw = 264012 
OR kwp.id_kw = 817869 
OR kwp.id_kw = 5531 
OR kwp.id_kw = 7167 
OR kwp.id_kw = 3462 
OR kwp.id_kw = 811564 

可以写成id_kw IN (264012, 817869, ...)

于 2012-05-30T07:25:19.813 回答