欢迎投稿

今日深度:

为提高查询速度建立索引(1)(2)

三、不可优化的where子句

1.例:下列SQL条件语句中的列都建有恰当的索引,但执行速度却非常慢:

  1. select * from record where substring(card_no,1,4)='5378'(13秒) 
  2. select * from record where amount/30< 1000(11秒) 
  3. select * from record where convert(char(10),date,112)='19991201'(10秒) 

分析:

where子句中对列的任何操作结果都是在SQL运行时逐列计算得到的,因此它不得不进行表搜索,而没有使用该列上面的索引;如果这些结果在查询编译时就能得到,那么就可以被SQL优化器优化,使用索引,避免表搜索,因此将SQL重写成

下面这样:

  1. select * from record where card_no like '5378%'(< 1秒) 
  2. select * from record where amount < 1000*30(< 1秒) 
  3. select * from record where date'1999/12/01' (< 1秒) 

你会发现SQL明显快起来!

2.例:表stuff有200000行,id_no上有非群集索引,请看下面这个SQL:

  1. select count(*) from stuff where id_no in('0','1')(23秒) 

分析:

where条件中的'in'在逻辑上相当于'or',所以语法分析器会将in ('0','1')转化为id_no ='0' or id_no='1'来执行。我们期望它会根据每个or子句分别查找,再将结果相加,这样可以利用id_no上的索引;但实际上(根据showplan), 它却采用了"OR策略",即先取出满足每个or子句的行,存入临时数据库的工作表中,再建立唯一索引以去掉重复行,最后从这个临时表中计算结果。因此,实际过程没有利用id_no上索引,并且完成时间还要受tempdb数据库性能的影响。

实践证明,表的行数越多,工作表的性能就越差,当stuff有620000行时,执行时间竟达到220秒!还不如将or子句分开:

  1. select count(*) from stuff where id_no='0' 
  2. select count(*) from stuff where id_no='1' 

得到两个结果,再作一次加法合算。因为每句都使用了索引,执行时间只有3秒,在620000行下,时间也只有4秒。或者,用更好的方法,写一个简单的存储过程:

  1. create proc count_stuff as 
  2. declare @a int 
  3. declare @b int 
  4. declare @c int 
  5. declare @d char(10) 
  6. begin 
  7. select @a=count(*) from stuff where id_no='0' 
  8. select @b=count(*) from stuff where id_no='1' 
  9. end 
  10. select @c=@a+@b 
  11. select @d=convert(char(10),@c) 
  12. print @d 

直接算出结果,执行时间同上面一样快!

总结:

可见,所谓优化即where子句利用了索引,不可优化即发生了表扫描或额外开销。

从以上这些例子可以看出,SQL优化的实质就是在结果正确的前提下,用优化器可以识别的语句,充份利用索引,减少表扫描的I/O次数,尽量避免表搜索的发生。其实SQL的性能优化是一个复杂的过程,上述这些只是在应用层次的一种体现,深入研究还会涉及数据库层的资源配置、网络层的流量控制以及操作系统层的总体设计。


www.htsjk.Com true http://www.htsjk.com/shujukugl/17758.html NewsArticle 三、不可优化的where子句 1.例:下列SQL条件语句中的列都建有恰当的索引,但执行速度却非常慢: select * from record where substring (card_no,1,4)= '5378' (13秒) sele...
评论暂时关闭