2

我正在制定一个优化我的数据库索引的程序,这将花费我很长时间。所以我想确认这样做是否可行?并没有已经完成,否则想要得到它。

  1. 我想从所有表中读取所有索引。
  2. 我想删除作为主键的字段的所有其他索引
  3. 做完以上。仍被索引为唯一的字段。我想删除所有其他索引
  4. 既不是主要的也不是唯一的字段。我只想在每个索引上保留一个索引并删除所有其他索引

我很好奇为什么MYSQL允许主键字段上的唯一索引?它可以产生任何有用的差异吗?

问题:我需要指导/查询/程序来删除所有无用的索引以及我上面提到的 4 点中提到的层次结构

更新 1:我将在 SQLFiddle 上更新我的工作。目前它才刚刚开始。但是,您可以在此链接上看到有四个字段和 8 个索引。我只想要其中的 3 个,而放弃所有其他的。我只需要第一,第三和第四。根据我以上4点。

更新 2:我得到了 eggayal 的出色回答。他给出的第一个链接是纯sql解决方案。我在 Link2尝试过。它给了我不想要的输出。可以通过在此处查看 Link1来比较 link2 的输出

期望的输出是

    COLUMN_NAMES REDUNDANT_INDEXES
1 auth_id `auth_id_3`,`auth_id_2`,`auth_id`
2 id `id_2`,`id_3`
3 主题`subject_1`

Link2中查询输出的错误

auth_id_4第 1 行:auth_id 未显示为冗余索引,因为它与同一字段上的唯一键无关(比较) 。但我需要它,因为当同一列也有唯一索引时我不需要这个索引

Row2 :当某些列上存在主键索引时,我想说所有其他索引都是多余的

第 3 行:好的

4

3 回答 3

2

Roland Bouman 写了一篇关于这个主题的博客文章,展示了一个纯 SQL 解决方案。

Google 上的快速搜索也引起了人们的注意:

于 2012-10-05T08:42:44.130 回答
2

我在c#中做了一个应用程序。它会根据您的优先级删除重复的索引,希望对您有所帮助

它可能需要很多改进,但我知道的是......它不会一次只删除那些涉及主(复合)和外键的重复索引(这通常不是好方法)

这是带有源的完整应用程序的下载链接

以下是上述链接的主文件

using System;
using System.Data;
using MySql.Data.MySqlClient;
using System.Collections.Generic;

namespace duplicateIndexRemover
{
public class duplicateIndexRemover
{

    static List<string> toDrop;
    public string main(System.Windows.Forms.DataGridView dgv, System.Windows.Forms.DataGridView dgv1, string dbName)
    {            
        try
        {
            toDrop = new List<string>();
            List<table> tbs = new List<table>();
            DataTable dt1 = new DataTable();
            string cnStr = "SERVER=localhost;DATABASE=" + dbName + ";UID=root;";
            MySqlConnection conn = new MySqlConnection(cnStr);
            MySqlCommand cmd = conn.CreateCommand();
            cmd.CommandText = @"SELECT Table_Name,Column_Name,Index_Name,NON_UNIQUE
            FROM information_schema.STATISTICS
            WHERE table_schema = '" + dbName + "' order by Table_Name,Column_Name,Index_Name";
            MySqlDataAdapter adp = new MySqlDataAdapter(cmd);
            DataTable dt = new DataTable();
            adp.Fill(dt);
            dgv.DataSource = dt;
            for (int i = 0; i < dt.Columns.Count - 1; i++)
                dt1.Columns.Add(dt.Columns[i].ColumnName);

            table tb = new table();
            column cl = new column();
            index dx = new index();
            tb.nam = dt.Rows[0][0].ToString();
            cl = addColumn(dt, tb, 0);
            tbs.Add(tb);

            for (int i = 1; i < dt.Rows.Count; i++)
            {
                if (tb.nam != dt.Rows[i][0].ToString())
                {
                    // 1st column of (current) t_th table
                    tb = new table();
                    tb.nam = dt.Rows[i][0].ToString();
                    cl = addColumn(dt, tb, i);
                    tbs.Add(tb);
                }
                else
                {
                    if (cl.nam != dt.Rows[i][1].ToString())
                        cl = addColumn(dt, tb, i);
                    else
                    {

                        // Duplicate Indices
                        // But this one may be primary/unique key
                        // Then it would not be good to make a drop statement for this index here
                        // It may be improvable, but i can not apply as well condition here if it is not primary key
                        addIndex(dt, cl, i);
                    }
                }
            }
            makeDropStatements(tbs, dt1);

            dgv1.DataSource = dt1;
            cmd.Connection.Open();
            for (int i = 0; i < toDrop.Count; i++)
            {
                cmd.CommandText = toDrop[i];
                try
                {
                    cmd.ExecuteScalar();
                }
                catch//(Exception ex)
                {
                    //System.Windows.Forms.MessageBox.Show("Table : " + dt1.Rows[i][0] + " Column : " + dt1.Rows[i][1] + "\n\n" + ex.Message);
                }
            }

            cmd.CommandText = @"select table_name from information_schema.STATISTICS
            WHERE table_schema = '" + dbName + "' group by table_name,column_name";
            DataTable dg = new DataTable();
            adp.Fill(dg);

            string msg = " Total Number of Indices : " + dt.Rows.Count;
            msg += "\t Droppable Indices : " + toDrop.Count;
            msg += "\t Total Number of Indexed Columns : " + dg.Rows.Count;
            return msg;
        }
        catch (Exception ex)
        {
            System.Windows.Forms.MessageBox.Show(ex.Message);
            return ex.Message;
        }
    }

    private static column addColumn(DataTable dt, table tb, int i)
    {
        column cl = new column();
        // 1st index of i_th column of t_th table
        cl.nam = dt.Rows[i][1].ToString();
        addIndex(dt, cl, i);
        tb.cols.Add(cl);
        return cl;
    }

    private static void addIndex(DataTable dt, column cl, int i)
    {
        index dx = new index();
        dx.nam = dt.Rows[i][2].ToString();
        dx.non_unique = Convert.ToBoolean(dt.Rows[i][3]);
        cl.indices.Add(dx);
    }


    private static void makeDropStatements(List<table> tbs, DataTable dt1)
    {
        bool chekd;
        List<index> temp;
        for (int t = 0; t < tbs.Count; t++)
        {                
            for (int i = 0; i < tbs[t].cols.Count; i++)
            {                    
                temp = tbs[t].cols[i].indices;
                if (temp.Count > 1)
                {

                    chekd = false;
                    for (int j = 0; j < temp.Count; j++)
                    {
                        if (temp[j].nam == "PRIMARY")
                        {
                            getToDropIndices(tbs[t].nam, tbs[t].cols[i].nam, temp, j, dt1);
                            chekd = true;
                            break;
                        }
                    }
                    if (!chekd)
                    {
                        for (int j = 0; j < temp.Count; j++)
                        {
                            if (!temp[j].non_unique)
                            {
                                getToDropIndices(tbs[t].nam, tbs[t].cols[i].nam, temp, j, dt1);
                                chekd = true;
                                break;
                            }
                        }
                    }
                    if (!chekd)
                    {
                        getToDropIndices(tbs[t].nam, tbs[t].cols[i].nam, temp, 0, dt1);
                        chekd = true;
                        break;
                    }
                }
            }
        }
    }

    private static void getToDropIndices(string tbl, string col, List<index> sublist, int nt, DataTable dt1)
    {
        for (int j = 0; j < nt; j++)
        {
            toDrop.Add("alter table `" + tbl + "` drop index " + sublist[j].nam);
            dt1.Rows.Add(dt1.NewRow());
            int r = dt1.Rows.Count - 1;
            dt1.Rows[r][0] = tbl;
            dt1.Rows[r][1] = col;
            dt1.Rows[r][2] = sublist[j].nam;
        }
        for (int j = nt + 1; j < sublist.Count; j++)
        {
            toDrop.Add("alter table `" + tbl + "` drop index " + sublist[j].nam);
            dt1.Rows.Add(dt1.NewRow());
            int r = dt1.Rows.Count - 1;
            dt1.Rows[r][0] = tbl;
            dt1.Rows[r][1] = col;
            dt1.Rows[r][2] = sublist[j].nam;
        }
    }
}

public class table
{
    public List<column> cols =new List<column>();
    public string nam = "";
}

public class column
{
    public List<index> indices = new List<index>();
    public string nam = "";
}

public class index
{
    public string nam = "";
    public bool non_unique;
}
}

您可以忽略/删除它们仅用于显示您的索引的网格视图。你只需要调用 main 函数

于 2012-10-30T12:53:13.127 回答
1

根据我在链接中看到的内容,似乎确实有许多无关索引,例如:

KEY `auth_id_2` (`auth_id`),
KEY `auth_id_4` (`auth_id`),
KEY `auth_id_5` (`auth_id`),
KEY `auth_id_6` (`auth_id`)

我想也许它们是以不同的方式建造的。例如,一个可能是 BTREE,另一个可能是 HASH,这可能会达到某种目的。但是根据SHOW,它们都是一样的。删除多余的相同的应该不是问题。

例如,拥有所有这三个是有目的的:

KEY `articleid` (`artid`),
KEY `artSub` (`artSub`),
KEY `comments_ibfk_3` (`artSub`,`artid`)

在两列上构建索引不一定与在一个列上构建两个单独的索引相同。

于 2012-10-05T08:21:29.107 回答