有一个足够大的商品数据库,并且稳步增长。现在数据库中有超过1000万件商品。
有一个好,有它的类别。每种商品都具有以下属性:名称、价格、售出商品数量、保证标志和质量等。产品的特性仅针对特定类别。货物的属性具有下一个格式 - 2000:10000(属性类别:属性值)。某些类别的属性和属性本身可能在各种类别中重叠,例如品牌。通过这些类别和属性执行对标题和属性的过滤、排序和搜索。产品可以链接到一个或多个类别。
起初我们只使用 mysql 并通过为每个类别创建一个表来存储商品。这样,我们就有了大约 6-7 千张带商品的桌子。在选择时,我们向他们每个人提出请求,在操作员 UNION 的帮助下合并请求。随着商品数量和类别的增加,选择开始花费很长时间,并且铺设了mysql服务器。在此之后,我们将所有产品移动到一个表中。表结构如下 [follows]( http://clip2net.com/s/5OUKXm。
1000万个产品的表,让mysql现在很难用了。从中选择是不太可能的,不谈论排序。我们使用了 sphinx,索引 sphinx:
sql_query = SELECT \
ti.item_id, \
ti.item_id AS iid, \
crc32(ti.item_nick) AS nick, \
ti.item_title AS title, \
ti.item_sold AS sold, \
ti.item_rating AS rating, \
ti.item_popular AS popular, \
ti.item_warranty AS warranty, \
ROUND(ti.item_price*100, 0) AS price, \
ti.item_props AS props, \
COUNT(c.comment_iid) AS comments, \
GROUP_CONCAT(tcir.category_item_ref_tid) AS tids \
FROM item AS ti \
LEFT JOIN comment AS c ON ti.item_id = c.comment_iid \
INNER JOIN category_item_ref AS tcir ON ti.item_id = tcir.category_item_ref_iid \
WHERE ti.item_id >= $start AND ti.item_id <= $end \
GROUP BY ti.item_id
sql_attr_uint = sold
sql_attr_uint = rating
sql_attr_uint = comments
sql_attr_uint = warranty
sql_attr_bigint = iid
sql_attr_bigint = nick
sql_attr_bigint = price
sql_attr_bigint = popular
sql_attr_multi = uint tids from field;
通过 Sphinx 搜索更快,但有许多属性,特别是 sql_attr_multi tids 会减慢搜索和排序。60万件商品的采样时间约为18~19秒。我们试图将产品仅与一个类别联系起来(属性 tids 变为 sql_attr_uint)。采样时间减少到3~5秒,也不是很好。
你能告诉我我做错了什么吗,以另一种方式为狮身人面像建立一个索引可能是值得的,因为我认为它应该工作得更快。也许,我需要用另一种方式构建表结构,或者为数据库使用不同的平台,例如 MySQL、MongoDB、PostgreSQL、MariaDB。