SQL优化-索引

   日期:2020-09-11     浏览:110    评论:0    
核心提示:SQL优化-索引索引的优势和劣势索引的分类和索引命令语句索引分类基本语法判断是否适合建索引适合建立索引的情况不适合建立索引的情况性能分析MySql Query OptimizerMySql 常见瓶颈EXPLAIN(查看执行计划)如何使用?包含信息索引的优势和劣势索引简单来说是排好序的数据结构,所以它能大幅度的提高查询效率,降低数据排序的成本,降低数据库的IO成本。但是索引也同样占用很大空间,通常是以索引文件的形式存储在磁盘上,并且更新数据的同时得更新相应的索引。总的来说:索引能提高查询效率,但降低更

SQL优化-索引

  • 索引的优势和劣势
  • 索引的分类和索引命令语句
      • 索引分类
      • 基本语法
  • 判断是否适合建索引
      • 适合建立索引的情况
      • 不适合建立索引的情况
  • 性能分析
      • MySql Query Optimizer
      • MySql 常见瓶颈
  • EXPLAIN(查看执行计划)
      • 如何使用?
      • 包含信息
  • EXPLAIN实际运用
      • 单表
      • 两表连接
      • 检验索引是否失效

索引的优势和劣势

索引简单来说是排好序的数据结构,所以它能大幅度的提高查询效率,降低数据排序的成本,降低数据库的IO成本。

但是索引也同样占用很大空间,通常是以索引文件的形式存储在磁盘上,并且更新数据的同时得更新相应的索引。

总的来说:索引能提高查询效率,但降低更新效率,所以经常更新的表尽量不要加索引

索引的分类和索引命令语句

索引分类

  1. 单值索引:一个索引只包含单个列,一个表可以有多个单值索引。
  2. 唯一索引:索引列的值必须唯一,但允许有空值
  3. 复合索引:一个索引包含多个列

一张表建议建立索引不要超过五个

基本语法

  1. 创建:
    (1)CREATE [UNIQUE] INDEX indexname ON mytable(columnname(length));
    (2)ALTER mytable ADD [UNIQUE] INDEX [indexname] ON (columnname(length));
  2. 删除:DROp INDEX [indexname] ON mytable;
  3. 查看:SHOW INDEX FROM table_name\G;
    (\G存在的情况下列形式显示,不存在的情况下行形式显示)
  4. 使用ALTER命令:ALTER TABLE mytable ADD (PRIMARYKEY)((UNIQUE|INDEX|FULLTEXT)indexname)(column_list);
    PRIMARYKEY:唯一索引(主键索引,一般自动添加),索引值唯一,且不能为null。
    UNIQUE:唯一索引,索引值唯一,可出现null,且null可重复出现。
    INDEX:普通索引,索引值可出现多次。
    FULLTEXT:全文索引。

判断是否适合建索引

适合建立索引的情况

  1. 主键自动建立唯一索引
  2. 频繁作为查询条件的字段
  3. 查询中与其它表关联的字段
  4. 查询中排序的字段
  5. 查询中统计或分组的字段

不适合建立索引的情况

  1. 频繁更新的字段(更新不止是更新记录,还得更新索引)
  2. Where语句用不到的字段
  3. 表的记录不多
  4. 频繁增删改的表
  5. 数据列大量重复内容(如:性别,只有 男,女)

一般来说复合索引优于单值索引

性能分析

MySql Query Optimizer

MySql自带的查询优化器,MySql有专门负责优化SELECt语句的优化器模块。

MySql 常见瓶颈

  1. CPU:CPU在饱和的时候,一般发生在数据装入内存或者从磁盘读取数据的时候。
  2. IO:磁盘I/O瓶颈常发生在装入数据远大于内存容量的时候。
  3. 服务器硬件问题。

EXPLAIN(查看执行计划)

使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySql是如何处理你的SQL语句,从中得出如何优化你的SQL语句。

如何使用?

在SQL语句前+EXPLAIN关键字(如:explain select * from userdb)

包含信息

  1. id:select查询的序列号,表示操作顺序,id相同的情况下顺序由上到下,id不同的情况下顺序由大到小。
  2. select_type:查询类型,主要用于区别普通查询,联合查询,嵌套查询等的复合查询。
  3. table:显示这一行数据是关于哪张表
  4. type:从好到怀:system(表只有一行记录,系统表)>const(通过一次索引就找到)>eq_ref(唯一索引扫描)>ref(非唯一索引扫描)>range(只索引给定范围)>index(全索引扫描)>all(全表扫描) 一般来说要保证达到range级别
  5. possible_keys:可能用到的哪些索引
  6. key:实际用到的索引
  7. key_len:索引中使用的字节数,在不损失精确性的情况下,越小越好。
  8. ref:显示索引的哪些列被使用
  9. rows:查找到所需数据的行数
  10. extra: 加分项:USING index , 扣分项:USING filesort、USING temporary(有扣分项的情况下尽量优化)

EXPLAIN实际运用

单表

  • 创建表
CREATE TABLE IF NOT EXISTS blogs(
id INT(10) UNSIGNED NOT NULL PRIMARY KEY AUTO_INCREMENT,
author_id INT(10) UNSIGNED NOT NULL,
category VARCHAR(20) NOT NULL,
views INT(20) NOT NULL,
assist INT(20) NOT NULL,
comments VARCHAR(20) NOT NULL,
title VARCHAR(255) NOT null,
content TEXT NOT NULL);
  • 插入数据
INSERT INTO blogs(author_id,category,views,assist,comments,title,content)VALUES
(1,'java',821,100,'1','java','1'),
(2,'sql',534,100,'2','sql','1'),
(3,'c',1928,100,'3','c','1'),
(4,'c++',851,100,'4','c++','1'),
(5,'c#',89,50,'5','c#','1');
  • 没有建立索引的情况下用EXPLAIN:
EXPLAIN SELECT id, author_id  from blogs where comments = '1' and views > 1 ORDER BY assist desc LIMIT 1;

  • 查找表中的索引
show index from blogs;

这里只有sql自主建的主键索引

  • 建立索引
create index idx_blogs_cva on blogs (comments,views,assist);
  • 再查找表中的索引
show index from blogs

  • 再用EXPLAIN查看性能
EXPLAIN SELECt id, author_id  from blogs where comments = '1' and views > 1 ORDER BY assist desc LIMIT 1;


这里很明显已经用到了索引,但是Extra里面出现了Using filesort,SQL需要优化

  • 优化方式:删除索引,再建立comments,assist索引(具体原因,后面会说到)
Drop index idx_blogs_cva on blogs;
create index idx_blogs_ca on blogs(comments,assist);
EXPLAIN SELECT id, author_id  from blogs where comments = '1' and views > 1 ORDER BY assist desc LIMIT 1;

两表连接

  • 创建表
CREATE TABLE IF NOT EXISTS class(
	class_id INT(10) UNSIGNED NOT NULL PRIMARY KEY AUTO_INCREMENT,
	class_card INT(20) UNSIGNED NOT NULL
);

CREATE TABLE IF NOT EXISTS book(
	book_id INT(10) UNSIGNED NOT NULL PRIMARY KEY AUTO_INCREMENT,
	book_card INT(20) UNSIGNED NOT NULL
);
  • 插入数据
INSERT INTO book(book_card) VALUES(FLOOR(1+(RAND()*10)));
INSERT INTO book(book_card) VALUES(FLOOR(1+(RAND()*10)));
INSERT INTO book(book_card) VALUES(FLOOR(1+(RAND()*10)));
INSERT INTO book(book_card) VALUES(FLOOR(1+(RAND()*10)));
INSERT INTO book(book_card) VALUES(FLOOR(1+(RAND()*10)));
INSERT INTO book(book_card) VALUES(FLOOR(1+(RAND()*10)));
INSERT INTO book(book_card) VALUES(FLOOR(1+(RAND()*10)));
INSERT INTO book(book_card) VALUES(FLOOR(1+(RAND()*10)));
INSERT INTO book(book_card) VALUES(FLOOR(1+(RAND()*10)));
INSERT INTO book(book_card) VALUES(FLOOR(1+(RAND()*10)));
  • 在没建索引的情况下用EXPLAIN查看两表连接
EXPLAIN SELECt * FROM book RIGHT JOIN class ON class_card = book_card; 

  • 建立索引优化
ALTER TABLE book ADD INDEX idx_book_c (book_card);
  • 再用EXPLLAIN查看
EXPLAIN SELECt * FROM book RIGHT JOIN class ON class_card = book_card; 

  • 建立class的索引,再用EXPLAIN
ALTER TABLE class ADD INDEX idx_class_c (class_card);
EXPLAIN SELECt * FROM book RIGHT JOIN class ON class_card = book_card; 

-删除book索引,再用EXPLAIN

DROp index idx_book_c on book;
EXPLAIN SELECT * FROM book RIGHT JOIN class ON class_card = book_card; 


很明显效率不如添加book表的索引好
总结一下:right join (右连接) ,用左表建索引效果高于右表,left join (左连接) 同理,即:与连接相对的表建立索引效果较好。 尽量用小结果集驱动大结果集(如右连接,就是左表驱动右边,在左表建立索引的效果要好于右表)。

检验索引是否失效

  • 首先建立表并插入一些数据,创建表,并用EXPLAIN查看索引是否失效
CREATE TABLE students(
id INT(10) UNSIGNED NOT NULL PRIMARY KEY AUTO_INCREMENT,
name VARCHAR(20) NOT NULL,
age INT(10) UNSIGNED NOT NULL DEFAULT 0,
grade INT(10) UNSIGNED NOT NULL  DEFAULT 0,
pos VARCHAR(20)  DEFAULT ''
);

INSERT INTO students(name,age,grade,pos) VALUES ('zs',20,97,'monitor');
INSERT INTO students(name,age,grade,pos) VALUES ('ls',22,74,'committee');
INSERT INTO students(name,age,grade,pos) VALUES ('ww',21,100,'committee');
INSERT INTO students(name,age,grade,pos) VALUES ('mw',21,59,'personal');
INSERT INTO students(name,age,grade,pos) VALUES ('zl',21,87,'personal');

ALTER TABLE students ADD INDEX idx_students_nap (name, age, pos);

EXPLAIN SELECt * FROM students WHERe name='zs'; 

EXPLAIN SELECt * FROM students WHERe name='zs' AND age=20; 

EXPLAIN SELECt * FROM students WHERe name='zs' AND age=20 AND pos='monitor'; 


很明显,三条语句依次是增加了精度,同时key_len也增加,但是都用到了索引
现在看看索引失效的情况:

EXPLAIN SELECt * FROM students WHERe  age=20 AND pos='monitor'; 

EXPLAIN SELECt * FROM students WHERe  pos='monitor'; 

EXPLAIN SELECt * FROM students WHERe  age=20; 


这三次效果一样,都是全表扫描

由此得出:查询应从索引的最左前列开始并且不跳过索引中的列(即最佳左前缀法则)

 
打赏
 本文转载自:网络 
所有权利归属于原作者,如文章来源标示错误或侵犯了您的权利请联系微信13520258486
更多>最近资讯中心
更多>最新资讯中心
0相关评论

推荐图文
推荐资讯中心
点击排行
最新信息
新手指南
采购商服务
供应商服务
交易安全
关注我们
手机网站:
新浪微博:
微信关注:

13520258486

周一至周五 9:00-18:00
(其他时间联系在线客服)

24小时在线客服