3

我正在处理的事情:

我有一个使用ActiveCollab 2 的项目,并且数据库结构对我来说是新的 - 实际上所有内容都存储到一个project_objects表中并且具有递归的层次关系:

  • 记录 1234 可能是123 的type“票”parent_id
  • 记录 123 可能是12 的type“类别”parent_id
  • 记录 12 可能是type“里程碑”等等。

目前该表中有超过 450,000 条记录,并且代码中的许多查询都引用了name没有索引的字段。一个示例值可能是DesignDevelopment

这可能是一个示例查询:

SELECT * FROM project_objects WHERE type = "Ticket" and name = "Design"

我的问题:

我有一个查询需要 12-15 秒以上,我感觉它来自 name缺少索引并需要全文搜索的列。我对索引的理解是,如果我在name字段中添加一个,它会加快读取速度,但会减慢插入和更新速度。每次添加或更新记录时是否需要完全重建索​​引,还是只是更改/附加?如果这意味着大大减慢依赖于更快写入的代码库的其他部分,我不想使用索引优化此查询。

我的问题:

假设每天有 100 次读取和 100 次写入,这对于 MySQL 来说更有可能是一个更快的过程——在没有索引的情况下对上表执行上述查询,还是每次添加记录时都必须重建索引?

我没有开始运行基准测试的知识或权限,但我想在听起来完全是新手的情况下向客户提供建议。谢谢!

编辑:这是表格:

'CREATE TABLE `project_objects` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
  `source` varchar(50) DEFAULT NULL,
  `type` varchar(30) NOT NULL DEFAULT ''ProjectObject'',
  `module` varchar(30) NOT NULL DEFAULT ''system'',
  `project_id` int(10) unsigned NOT NULL DEFAULT ''0'',
  `milestone_id` int(10) unsigned DEFAULT NULL,
  `parent_id` int(10) unsigned DEFAULT NULL,
  `parent_type` varchar(30) DEFAULT NULL,
  `name` varchar(150) DEFAULT NULL,
  `body` longtext,
  `tags` text,
  `state` tinyint(4) NOT NULL DEFAULT ''0'',
  `visibility` tinyint(4) NOT NULL DEFAULT ''0'',
  `priority` tinyint(4) DEFAULT NULL,
  `created_on` datetime DEFAULT NULL,
  `created_by_id` smallint(5) unsigned NOT NULL DEFAULT ''0'',
  `created_by_name` varchar(100) DEFAULT NULL,
  `created_by_email` varchar(100) DEFAULT NULL,
  `updated_on` datetime DEFAULT NULL,
  `updated_by_id` smallint(5) unsigned DEFAULT NULL,
  `updated_by_name` varchar(100) DEFAULT NULL,
  `updated_by_email` varchar(100) DEFAULT NULL,
  `due_on` date DEFAULT NULL,
  `completed_on` datetime DEFAULT NULL,
  `completed_by_id` smallint(5) unsigned DEFAULT NULL,
  `completed_by_name` varchar(100) DEFAULT NULL,
  `completed_by_email` varchar(100) DEFAULT NULL,
  `comments_count` smallint(5) unsigned DEFAULT NULL,
  `has_time` tinyint(1) unsigned NOT NULL DEFAULT ''0'',
  `is_locked` tinyint(3) unsigned DEFAULT NULL,
  `estimate` float(9,2) DEFAULT NULL,
  `start_on` date DEFAULT NULL,
  `start_on_text` varchar(50) DEFAULT NULL,
  `due_on_text` varchar(50) DEFAULT NULL,
  `workflow_status` int(4) DEFAULT NULL,
  `varchar_field_1` varchar(255) DEFAULT NULL,
  `varchar_field_2` varchar(255) DEFAULT NULL,
  `integer_field_1` int(11) DEFAULT NULL,
  `integer_field_2` int(11) DEFAULT NULL,
  `float_field_1` double(10,2) DEFAULT NULL,
  `float_field_2` double(10,2) DEFAULT NULL,
  `text_field_1` longtext,
  `text_field_2` longtext,
  `date_field_1` date DEFAULT NULL,
  `date_field_2` date DEFAULT NULL,
  `datetime_field_1` datetime DEFAULT NULL,
  `datetime_field_2` datetime DEFAULT NULL,
  `boolean_field_1` tinyint(1) unsigned DEFAULT NULL,
  `boolean_field_2` tinyint(1) unsigned DEFAULT NULL,
  `position` int(10) unsigned DEFAULT NULL,
  `version` int(10) unsigned NOT NULL DEFAULT ''0'',
  PRIMARY KEY (`id`),
  KEY `type` (`type`),
  KEY `module` (`module`),
  KEY `project_id` (`project_id`),
  KEY `parent_id` (`parent_id`),
  KEY `created_on` (`created_on`),
  KEY `due_on` (`due_on`)
  KEY `milestone_id` (`milestone_id`)
) ENGINE=InnoDB AUTO_INCREMENT=993109 DEFAULT CHARSET=utf8'
4

2 回答 2

2

在列上添加单点索引的插入成本name很可能可以忽略不计——它可能相当于增加了一个恒定的时间,可能不会超过几毫秒。您会占用一些额外的磁盘空间,但这通常不是问题。没有什么比您在选择性能时所经历的多秒钟更重要的了。

添加索引,享受性能提升。

顺便说一句:索引不会在每次插入时都“重建”。它们通常在 B-Trees 中实现,除非您经常删除,否则一旦您的级别超过几个级别,应该需要很少的重新平衡(并且很少深度的重新平衡非常便宜)。

于 2013-01-21T18:04:22.940 回答
2

正如@Ray 指出的那样,不必在每次插入、更新或删除操作时都重建索引。因此,如果您只想提高此(或类似)查询的效率,请添加索引 on(name, type)或 on (type, name)

由于您已经有一个(type)单独的索引,我将添加第一个:

ALTER TABLE project_objects 
  ADD INDEX name_type_IDX
    (name, type) ;

在繁忙的服务器上可能需要几秒钟,但必须完成一次,然后所有具有像您这样的条件的查询都会受益。它还可以提高name仅涉及 orname和的其他几种类型的查询的效率type

WHERE name = 'Design' AND type = 'Ticket'      --- your query

WHERE name = 'Design'                          --- condition on `name` only 

GROUP BY name                                  --- group by  `name`

WHERE name LIKE 'Design%'                      --- range condition on `name` only

WHERE name = 'Design'                          --- equality condition on `name`
  AND type LIKE 'Ticket%'                      --- and range condition on `type`

WHERE name = 'Design'                          --- equality condition on `name`
GROUP BY type                                  --- and group by `type`

GROUP BY name                                  --- group by  `name`
       , type                                  --- and  `type`
于 2013-01-21T20:47:56.367 回答