oracle取左表不在右表记录的3种方法-引申到db2-开发系列(五)
引:
我们在做数据库开发用 pl sql 加工数据时,经常会遇到取a表不在b表中的记录 或者 左表不在右表中的记录 的情况,所以特地对此做个简单的总结,以便以后用到回顾。
解决:
取a表某字段不在b表 我们自然的逻辑会想到用 a not in b ,这是第一种方法
1 not in
如下图 ,数据库为不跑业务的测试数据库,两张表的数据量一样, 用not in 可以找出a表中prd_inst_id不在t表中的记录
如下图,为生产库的表 l 和t表数据量相同,数据量900w左右
2 not exsits
1) 如下图,用的 not exists 找出 a表prd_inst_id 不在b表的记录
2)
select ssss1.* from odso.tb_b_ft_broadband_l ssss1 where not exists (select 1 from tb_b_ft_broadband b where ssss1.prd_inst_id = b.prd_inst_id); --2min 30s
3 left join or right join 特别注意 一般不会想到这个
如下图:先用a表 左关联b表 取到a表所有记录的结果集 ,再限制 b.latn_id is null (假设b 本身记录latn_id没有是空的) 实际上应该用b.prd_inst_id is null (关联字段)
即可得到 b表中没有a表prd_inst_id的那些记录,即a表不在b表的记录
上面的所有情况都是a表不在b表的记录占 总记录数据是很少的情况,几百万分之一
从效率上看,测试库的 not in 比 not exsits 在20w及的数据量下 快,差距虽然2倍,但是时间相差不大。
生产库的not exists 比 not in快很多 两分钟,所以关于 not in 及not exists 哪个更快的问题 要看具体情况及执行计划,
再看left join 时间花了 10分钟,比 not in 及exists 满了 好几倍,
但是在db2里面 一般 找数据量大的不存在于 一般都用left join 关联字段为分布键,会很快。
备注:
第3种 left join ,有时候面试的时候或许会问到。 防止紧张 想不起来
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。