hive学习笔记,
Hive目前还不支持事务;不能对表数据进行修改(不能更新、
删除、插入;只能通过文件追加数据、重新导入数据);不能对列建立索引(但
是Hive支持索引的建立,但是不能 高Hive的查询速度。如果你想 高Hive的
查询速度,请学习Hive的分区、桶的应用
1:在服务器上通过hive进入hive编辑界面
2:hive的in无法支持select子句
3:hive的yyyy-MM-dd HH:mm:ss 转 yyyy-MM-dd的方式是to_date(time)
4:hive通过show tables like '*names*'去查询这个库是否有某个table
5:hive的分区字段通过show create table names后的PARTITIONED BY参数
6:hive中group by后select选项中只能有group by的列和其他列的聚合查询
7:hive中有动态分区的,如果在查询中通过添加特定的分区位置,查询会更快,分区结构通过show create table查看其中的PARTITIONED BY的字段
8:将hive的查询结果导入本地,只需要在查询语句前面加上insert overwrite local directory "/home/test/"
9:通过select INPUT__FILE__NAME from table where dt='20170303' limit 10;可以直接查询到该分区具体的存放位置
10:show partitions tablename;显示该表目前的分区情况
11:显示查询的列名:set hive.cli.print.header=true; 12:hive -e "$v_sql;" 通过-e来实现shell查询hive 13:删除分区语句ALTER TABLE table_name DROP IF EXISTS PARTITION (dt='20170531');
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。