Hive基本操作,
Hive基本操作, 数据库操作 查看所有的数据库 hive show databases ; 使用数据库 default hive use default; 查看数据库信息 hive describe database default; OK db_name comment location owner_name owner_type parameters...(发布于2020-01-25 22:54:40)
Hive(一),
Hive(一), 1、什么是 hive 1、什么是`hive` hive 基于 hadoop 分布式文件系统 hdfs 开发的一个 ETL(从数据源抽取Extract,并清洗交互转换Transform到加载Load目的端的一个过程) 和 数据仓储工具。...(发布于2020-01-25 22:54:36)
Hive的一些问题,
Hive的一些问题, #在hive Cli中不能对表删除(对表或库操作时)的时候或者是 (Unable to fetch table : Hive MetaException message:For direct MetaStore DB connections, we don't support retries at the client level.)乱...(发布于2020-01-25 22:54:32)
hive安装问题,
hive安装问题, 问题: ①minal initialization failed; falling back to unsupported 解决方法: hadoop目录下存在老版本jline, 将hive下的新版本jline的JAR包拷贝到hadoop下,删除老版本hive启动移除 2. ②...(发布于2020-01-24 22:51:55)
日志分析hive,
日志分析hive, hadoop fs -put logs_20160522 /nginx/ 20160523 date = `/bin/date +%Y%m%d` /letv/ data /apache -hive - 0.13 .1 -bin /bin/hive -e "CREATE EXTERNAL TABLE if not exists nginx_20160620( host STRING, uri STRING, request_method...(发布于2020-01-24 22:51:51)
HIVE 基本语法,
HIVE 基本语法, DDL Operations 创建表 hive CREATE TABLE pokes (foo INT, bar STRING); 创建表并创建索引字段ds hive CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (ds STRING); 显示所有表 hive SHOW TABLES; 按正...(发布于2020-01-24 22:51:48)
hive学习笔记,
hive学习笔记, 自己学习总结,学习交流加群460570824 什么是Hive: Hive是基于Hadoop之上的数据仓库,数据存放在HDFS上,它同样可以通过ETL来进行数据的抽取、转换和加载。同时Hive可以...(发布于2020-01-24 22:51:44)
Hive——SerDe,
Hive——SerDe, 一、背景 1、当进程在进行远程通信时,彼此可以发送各种类型的数据,无论是什么类型的数据都会以二进制序列的形式在网络上传送。发送方需要把对象转化为字节序列...(发布于2020-01-24 22:51:40)
Hive优化,
Hive优化, 要点:优化时,把 hive sql 当做 map reduce 程序来读,会有意想不到的惊喜。 理解 hadoop 的核心能力,是 hive 优化的根本。 长期观察 hadoop 处理数据的过程,有几个显著的特...(发布于2020-01-24 22:51:37)
hive sql优化,
hive sql优化, 一、 Hive join优化1. 尽量将小表放在join的左边,我们这边使用的hive-0.12.0,所以是自动转化的,既把小表自动装入内存,执行map side join(性能好), 这是由参数hive...(发布于2020-01-24 22:51:33)
hive权限控制,
hive权限控制, Hive由一个默认的设置来配置新建文件的默认权限。 Xml代码 property name hive.files.umask.value / name value 0002 / value description The dfs.umask value for the ...(发布于2020-01-24 22:51:29)
hive笔记,
hive笔记, HiveServer2 is a rewrite of HiveServer that addresses these problems, starting with Hive 0.11.0. Use of HiveServer2 is recommended. HiveServer was removed from Hive releases starting in Hive 1.0.0 (formerly called 0.14.1). Ple...(发布于2020-01-24 22:51:25)
hive的安装,
hive的安装, 安装模式: 前提:只需要选择任意一台hadoop的节点进行安装,Hadoop正常,jdk安装完毕。 按照元数据库分: 1)使用自带的元数据库---derby(关系型数据库...(发布于2020-01-24 22:51:17)
Hive安装,
Hive安装, Hive安装 Hive 有三种搭建模式 local模式 (本地derby) 连接到一个In-memory 的数据库Derby(自带的),一般用于Unit Test Hive单用户模式(本地mysql) 需要在本地运行一个mysql服...(发布于2020-01-23 22:55:10)
hive调优,
hive调优, 一、 控制hive任务中的map数: 1. 通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有: input的文件总个数,input的文件大小,集群设...(发布于2020-01-23 22:55:06)
Hive数据倾斜,
Hive数据倾斜, 在做Shuffle阶段的优化过程中,遇到了数据倾斜的问题,造成了对一些情况下优化效果不明显。主要是因为在Job完成后的所得到的Counters是整个Job的总和,优化是基于这些...(发布于2020-01-23 22:55:02)
Hive体系架构,
Hive体系架构, Hive 是什么 Hive 的体系架构 上图为Hive的体系架构图,主要由如下几部分组成 用户接口:Client Cli(Command-line shell),及shell 命令行,hive1的客户端,hive server2 提供了新的...(发布于2020-01-23 22:54:58)
Hive概述,
Hive概述, Hive概述 Hive简介: Hive是一种构建数据仓库的工具。 Hive内部也是有表的概念,Hive把数据存储到HDFS上。 它的元数据存到了本地的轻量级的Derby数据库中。元数据包括行的分隔...(发布于2020-01-23 22:54:55)
Hive安装部署,
Hive安装部署, 前期工作 安装Hive 编辑 /etc/profile 文件,在其中添加一下内容: export HIVE_HOME=/bigData/software/apache-hive- 2.1 . 1 -bin export PATH= $PATH : $HIVE_HOME /bin 环境变量生效: source /etc/prfi...(发布于2020-01-23 22:54:51)
Hive错误,
Hive错误, 1,因为某些原因,需要修改hdfs的端口,修改后hdfs和yarn正常,但是在使用hive的时候报错: FAILED:SemanticException Unable to determine if hdfs://**** is encrypted:java.lang.IllegalArgumentExcetion...(发布于2020-01-23 22:54:47)