欢迎投稿

今日深度:

oracle取左表不在右表记录的3种方法-引申到db2-开

oracle取左表不在右表记录的3种方法-引申到db2-开发系列(五)


引:

我们在做数据库开发用 pl sql 加工数据时,经常会遇到取a表不在b表中的记录 或者 左表不在右表中的记录 的情况,所以特地对此做个简单的总结,以便以后用到回顾。

解决:

取a表某字段不在b表 我们自然的逻辑会想到用 a not in b ,这是第一种方法

1 not in

如下图 ,数据库为不跑业务的测试数据库,两张表的数据量一样, 用not in 可以找出a表中prd_inst_id不在t表中的记录

\

如下图,为生产库的表 l 和t表数据量相同,数据量900w左右

\

2 not exsits

1) 如下图,用的 not exists 找出 a表prd_inst_id 不在b表的记录

\

2)

 

select ssss1.*
  from odso.tb_b_ft_broadband_l ssss1
 where not exists (select 1
          from tb_b_ft_broadband b
         where ssss1.prd_inst_id = b.prd_inst_id); --2min 30s

3 left join or right join 特别注意 一般不会想到这个

如下图:先用a表 左关联b表 取到a表所有记录的结果集 ,再限制 b.latn_id is null (假设b 本身记录latn_id没有是空的) 实际上应该用b.prd_inst_id is null (关联字段)

即可得到 b表中没有a表prd_inst_id的那些记录,即a表不在b表的记录

\

上面的所有情况都是a表不在b表的记录占 总记录数据是很少的情况,几百万分之一

从效率上看,测试库的 not in 比 not exsits 在20w及的数据量下 快,差距虽然2倍,但是时间相差不大。

生产库的not exists 比 not in快很多 两分钟,所以关于 not in 及not exists 哪个更快的问题 要看具体情况及执行计划,

再看left join 时间花了 10分钟,比 not in 及exists 满了 好几倍,

但是在db2里面 一般 找数据量大的不存在于 一般都用left join 关联字段为分布键,会很快。

备注:

第3种 left join ,有时候面试的时候或许会问到。 防止紧张 想不起来

www.htsjk.Com true http://www.htsjk.com/oracle/23637.html NewsArticle oracle取左表不在右表记录的3种方法-引申到db2-开发系列(五) 引: 我们在做数据库开发用 pl sql 加工数据时,经常会遇到取a表不在b表中的记录 或者 左表不在右表中的记录 的情况,所...
评论暂时关闭