hive 差集,
A表
| id | name | age | city |
| 1 | a | 18 | beijing |
| 2 | b | 20 | beijing |
| id | school | city |
| 1 | m | beijing |
| 3 | n | beijing |
| 5 | p | sichuan |
假设两个表的partition是city,现在的需求是求A表中存在而B表中不存在(A-B)的信息,筛选条件是"id"且city='beijing':
select A.id from(
(select * from A where A.city = 'beijing') T1
left outer join
(select * from B where B.city = 'beijing') T2
on A.id = B.id and B.id is NULL
)以上语句最后得到的结果是:“1”。即实现了根据id求两个表的差集。
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。