Hive 快速入门,
Hive 目前已经成为 Hadoop 大数据离线分析的标准工具,Hive 入门比较容易,但是深入还是有些困难。本次分享目的是带领大家快速入门 Hive,侧重于实用应用,并有一些原理和优化的内容。本场 Chat 的主要内容包括:
- Hive介绍
- 数据类型
- DDL语法
- DML语法
- HQL语法
- 连接
- 排序
- 自定义函数
- Hive执行原理
- Hive性能优化
- Hive高级知识
实录提要:
- 和 Hive 类似的工具还有哪些,能否做一个简单的比较和使用场景分析?
- Hive 有好的活跃社区推荐吗?
- Hive 与 SparkSQL 的目标与实现机制主要有何差异?适用场景有分别吗?
- 想知道如何进行 Hive SQL 的查询优化,有没有相关书籍推荐?
- 关于更新目标表,有哪几种比较好的处理方法?
- 推荐下关于 Hive 转 Mapreduce 原理或优化 Hive SQL 的书籍或博客之类的资料?
- Hive 的运维难度相比同类工具,难易程度?
阅读全文: http://gitbook.cn/gitchat/activity/5923fe6cdcac8b4e79ddf889
一场场看太麻烦?成为 GitChat 会员,畅享 1000+ 场 Chat !点击查看
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。