欢迎投稿

今日深度:

HASH JION AND NESTED JION

HASH JION AND NESTED JION


 关于HASH_JION的原理 我们在做hash_join关联的时候,一般会有两张表, 其中较小的表我们叫做:build input 较大的表我们叫做:probe input ; 那么oracle是如何让这两张表做关联的呢? 首先,oracle会选择build input,将其读入到内存中, 这里oracle会给hash_join一块单独的内存叫hash area, 如果build input小于指定的hash area则,再对probe input做hash 链接 如果我们的build input大于指定的hash area, 则build input和probe input做分区处理,将这两个划分到 不同的分区中去,如果划分后大小合适的话,则读入到hash area中做hash处理 如果划分后还是比较大的话,oracle会做nested—loops hash join处理, 直到符合hash area的大小。 详细资料:http://hwhuang.iteye.com/blog/1479076 ABOUT NESTED JOIN 这个连接的方法中有驱动表(外部表)的概念。 其实这个连接就是2层的嵌套循环问题,所以外层的循环表越小越好, 这样从理论上来说循环的次数将会减少,这也就是我们为什么将小表或者row source较小的表 作为外层循环表的理论依据。因为在正确的选择中这样的处理方式从理论上来说将会减少I/O的数量 但是这个也不是绝对的依据。 我们决定的那张表为驱动表也就是外部表对SQL的执行效率有重要的影响,其内部的连接方式是: row source1的row1-->probe row source2(驱动表,外部表)
row source1的row2-->probe row source2(驱动表,外部表) row source1的row3-->probe row source2(驱动表,外部表) 从它的运行原理上我们也能够看到row source2选择的重要性。 当然如果row source1比较小的话,这种执行方式的效率也会更高。 一般情况下row source1通过index去访问row source2的话效率也会更高,当然前提是row source2必须有index。 row source1去匹配row source2的所有行,如果有匹配的结果,则将其放入将要返回的结果集中。 看到这里,我们可能会想到,使用这种方式,原理上我们一定需要遵守两种最简单的条件,当然如果 不满足的话也没关系,只不过性能上会差一些吧, (1)我们在选择驱动表(外表)的时候尽量的选择小一些的,这样理论上物理的I/O将将会少一些。 (2)尽量的在驱动表上建立索引,这样的话查询的效率会高一些。
 

www.htsjk.Com true http://www.htsjk.com/shujukunews/1442.html NewsArticle HASH JION AND NESTED JION 关于HASH_JION的原理 我们在做hash_join关联的时候,一般会有两张表,其中较小的表我们叫做:build input较大的表我们叫做:probe input ;那么oracle是如何让这两张表做关联的...
评论暂时关闭