Hive的性能优化,
Hive的性能优化, 本文完全转自哥不是小萝莉的文章,特此声明,表示感谢! http://www.cnblogs.com/smartloli/ 1.概述 继续《 那些年使用Hive踩过的坑 》一文中的剩余部分,本篇博客赘述了在工...(发布于2019-12-19 22:54:34)
Hive深入浅出,
Hive深入浅出, Hive深入浅出 1. Hive是什么 1) Hive是什么? 这里引用 Hive wiki 上的介绍: Hive is a data warehouse infrastructure built on top of Hadoop. It provides tools to enable easy data ETL, a mechani...(发布于2019-12-18 22:58:55)
Hive操作,
Hive操作, 数据操作能力是大数据分析至关重要的能力。数据操作主要包括:更改(exchange),移动(moving),排序(sorting),转换(transforming)。Hive提供了诸多查询语句,关键字,操作和方法来...(发布于2019-12-18 22:58:51)
hive行列转换,
hive行列转换, 1.行专列 表数据: name ,subject ,score xiaoming|english|92.0 xiaoming|chinese|98.0 xiaoming|math|89.5 huahua|chinese|80.0 huahua|math|89.5 hive (hive) select name,concat_ws(',',collect_set(concat(subject,'=',score))...(发布于2019-12-18 22:58:48)
Hive是什么,
Hive是什么,...(发布于2019-12-18 22:58:44)
安装配置hive,
安装配置hive, 环境与条件 操作系统是ubuntu16.04 hadoop版本是 2.7.3,(我的是完全分布式并配置了ha),按照官方文档里面的说明,hadoop2.*版本及以上的hadoop需要hive2.*版本 mysql是直接apt...(发布于2019-12-18 22:58:40)
hive 安装,
hive 安装, hive-0.13.1-cdh5.2.0 路径: /opt/dev/hive/hive-0.13.1-cdh5.2.0 启动:hive 停止:quit; 环境变量 export HIVE_HOME= /opt/dev/hive/hive-0.13.1-cdh5.2.0 export PATH=$PATH:$HIVE_HOME/bin source /etc/pr...(发布于2019-12-18 22:58:36)
Hive:子查询,
Hive:子查询, Hive只支持在FROM子句中使用子查询,子查询必须有名字,并且列必须唯一:SELECT ... FROM(subquery) name ......(发布于2019-12-18 22:58:32)
hive mysql安装,
hive mysql安装, mysql下载地址: https://dev.mysql.com/downloads/mysql/8.0.html 1、点击画红圈处进入下载区域 2、更改下载版本 要现实的集群架构如下: 1、新增主机IP:10.0.18.106 i. 新主机,改IP、...(发布于2019-12-18 22:58:28)
Hive编程指南,
Hive编程指南, 第一二章、基本操作 1.set 命令 会打印出命名空间, hivevar 、 hiveconf 、 system 、 env 所有的变量。 还可以给变量附新的值。 2. Hive 中‘一次使用命令’ 将结果保存起来...(发布于2019-12-18 22:58:25)
Hive Partition,
Hive Partition, 重置HIVE 登录mysql [root @m ~] # mysql -uroot -p1 -MySQL drop database hive; create database hive; --修改数据库编码 alter database grant all on hive.* to hive@ '%' identified by '1' ; grant all on hive.* to hive...(发布于2019-12-18 22:58:20)
Delta Lake 0.5.0 正式发布,支持包括 Hive/Presto 等多种查询引擎,
Delta Lake 0.5.0 正式发布,支持包括 Hive/Presto 等多种查询引擎, Delta Lake 0.5.0 于2019年12月13日正式发布,正式版本可以到 这里 下载使用。这个版本支持多种查询引擎查询 Delta Lake 的数据,...(发布于2019-12-18 21:48:55)
Hive介绍,
Hive介绍, http://www.cnblogs.com/sharpxiajun/archive/2013/06/02/3114180.html 1.Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将...(发布于2019-12-18 00:09:37)
Hive初级,
Hive初级, Hive的内置函数和基本的UDF函数 1.内置函数 在Hive中给我们内置了很多函数官方地址 也可以在启动hive后输入命令查看函数: SHOW FUNCTIONS;DESCRIBE FUNCTION function_name;DESCRIBE FUNCTION...(发布于2019-12-18 00:09:34)
hive正则表达式,
hive正则表达式, hive正则表达式 Hive中的正则表达式还是很强大的。数据工作者平时也离不开正则表达式。对此,特意做了个hive正则表达式的小结。所有代码都经过亲测,正常运行。...(发布于2019-12-18 00:09:30)
Hive高级查询,
Hive高级查询, 1)配置查询头信息 在hive-site.xml hive.cli.print.header true /property hive.cli.print.current.db true 2)基本查询 -》全表查询 select * from empt; -》查询指定列select empt.empno,empt.empname from empt...(发布于2019-12-18 00:09:26)
hive 教程,
hive 教程, 学习hive的时候,遇到许多坑。然后看到许多不错的文章,记下来,以后看。收藏夹里的太乱了。 1、 http://blog.csdn.net/strongyoung88/article/details/53743937 2、 http://www.yiibai.com/hive/...(发布于2019-12-18 00:09:22)
hive的使用,
hive的使用, 第一部分 连接hive 服务器运行模式 虽然可以使用hive与shell交互的方式启动hive [root@mini1 ~]# cd apps/hive/bin [root@mini1 bin]# ll 总用量 32 -rwxr-xr-x. 1 root root 1031 4月 30 2015 beeline drwx...(发布于2019-12-18 00:09:18)
hive优化,
hive优化, 长期观察hadoop处理数据的过程,有几个显著的特征: 1.不怕数据多,就怕数据倾斜。 2.对jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次...(发布于2019-12-18 00:09:14)
hive tutorial,
hive tutorial, Apache HiveTutorial Apache HiveTutorialEdit PageBrowse SpaceAdd PageAdd News#editReport() Hive Tutorial Hive Tutorial Concepts What is Hive What Hive is NOT Data Units Type System Primitive Types Complex Types Built in oper...(发布于2019-12-18 00:09:09)