欢迎投稿

今日深度:

Hive基本操作,

Hive基本操作, 数据库操作 查看所有的数据库 hive show databases ; 使用数据库 default hive use default; 查看数据库信息 hive describe database default; OK db_name comment location owner_name owner_type parameters...(发布于2020-01-25 22:54:40)

Hive(一),

Hive(一), 1、什么是 hive 1、什么是`hive` hive 基于 hadoop 分布式文件系统 hdfs 开发的一个 ETL(从数据源抽取Extract,并清洗交互转换Transform到加载Load目的端的一个过程) 和 数据仓储工具。...(发布于2020-01-25 22:54:36)

Hive的一些问题,

Hive的一些问题, #在hive Cli中不能对表删除(对表或库操作时)的时候或者是 (Unable to fetch table : Hive MetaException message:For direct MetaStore DB connections, we don't support retries at the client level.)乱...(发布于2020-01-25 22:54:32)

hive安装问题,

hive安装问题, 问题: ①minal initialization failed; falling back to unsupported 解决方法: hadoop目录下存在老版本jline, 将hive下的新版本jline的JAR包拷贝到hadoop下,删除老版本hive启动移除 2.   ②...(发布于2020-01-24 22:51:55)

日志分析hive,

日志分析hive, hadoop fs -put logs_20160522 /nginx/ 20160523 date = `/bin/date +%Y%m%d` /letv/ data /apache -hive - 0.13 .1 -bin /bin/hive -e "CREATE EXTERNAL TABLE if not exists nginx_20160620( host STRING, uri STRING, request_method...(发布于2020-01-24 22:51:51)

HIVE 基本语法,

HIVE 基本语法, DDL Operations 创建表 hive CREATE TABLE pokes (foo INT, bar STRING); 创建表并创建索引字段ds hive CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (ds STRING); 显示所有表 hive SHOW TABLES; 按正...(发布于2020-01-24 22:51:48)

hive学习笔记,

hive学习笔记, 自己学习总结,学习交流加群460570824 什么是Hive:   Hive是基于Hadoop之上的数据仓库,数据存放在HDFS上,它同样可以通过ETL来进行数据的抽取、转换和加载。同时Hive可以...(发布于2020-01-24 22:51:44)

Hive——SerDe,

Hive——SerDe, 一、背景 1、当进程在进行远程通信时,彼此可以发送各种类型的数据,无论是什么类型的数据都会以二进制序列的形式在网络上传送。发送方需要把对象转化为字节序列...(发布于2020-01-24 22:51:40)

Hive优化,

Hive优化, 要点:优化时,把 hive sql 当做 map reduce 程序来读,会有意想不到的惊喜。 理解 hadoop 的核心能力,是 hive 优化的根本。   长期观察 hadoop 处理数据的过程,有几个显著的特...(发布于2020-01-24 22:51:37)

hive sql优化,

hive sql优化, 一、     Hive join优化1.     尽量将小表放在join的左边,我们这边使用的hive-0.12.0,所以是自动转化的,既把小表自动装入内存,执行map side join(性能好), 这是由参数hive...(发布于2020-01-24 22:51:33)

hive权限控制,

hive权限控制, Hive由一个默认的设置来配置新建文件的默认权限。 Xml代码   property       name hive.files.umask.value / name       value 0002 / value       description The dfs.umask value for the ...(发布于2020-01-24 22:51:29)

hive笔记,

hive笔记, HiveServer2 is a rewrite of HiveServer that addresses these problems, starting with Hive 0.11.0. Use of HiveServer2 is recommended. HiveServer was removed from Hive releases starting in Hive 1.0.0 (formerly called 0.14.1). Ple...(发布于2020-01-24 22:51:25)

hive的安装,

hive的安装, 安装模式:       前提:只需要选择任意一台hadoop的节点进行安装,Hadoop正常,jdk安装完毕。      按照元数据库分:       1)使用自带的元数据库---derby(关系型数据库...(发布于2020-01-24 22:51:17)

Hive安装,

Hive安装, Hive安装 Hive 有三种搭建模式 local模式 (本地derby)     连接到一个In-memory 的数据库Derby(自带的),一般用于Unit Test Hive单用户模式(本地mysql)    需要在本地运行一个mysql服...(发布于2020-01-23 22:55:10)

hive调优,

hive调优, 一、    控制hive任务中的map数:   1.    通常情况下,作业会通过input的目录产生一个或者多个map任务。   主要的决定因素有: input的文件总个数,input的文件大小,集群设...(发布于2020-01-23 22:55:06)

Hive数据倾斜,

Hive数据倾斜, 在做Shuffle阶段的优化过程中,遇到了数据倾斜的问题,造成了对一些情况下优化效果不明显。主要是因为在Job完成后的所得到的Counters是整个Job的总和,优化是基于这些...(发布于2020-01-23 22:55:02)

Hive体系架构,

Hive体系架构, Hive 是什么 Hive 的体系架构 上图为Hive的体系架构图,主要由如下几部分组成 用户接口:Client Cli(Command-line shell),及shell 命令行,hive1的客户端,hive server2 提供了新的...(发布于2020-01-23 22:54:58)

Hive概述,

Hive概述, Hive概述 Hive简介: Hive是一种构建数据仓库的工具。 Hive内部也是有表的概念,Hive把数据存储到HDFS上。 它的元数据存到了本地的轻量级的Derby数据库中。元数据包括行的分隔...(发布于2020-01-23 22:54:55)

Hive安装部署,

Hive安装部署, 前期工作 安装Hive 编辑 /etc/profile 文件,在其中添加一下内容: export HIVE_HOME=/bigData/software/apache-hive- 2.1 . 1 -bin export PATH= $PATH : $HIVE_HOME /bin 环境变量生效: source /etc/prfi...(发布于2020-01-23 22:54:51)

Hive错误,

Hive错误, 1,因为某些原因,需要修改hdfs的端口,修改后hdfs和yarn正常,但是在使用hive的时候报错: FAILED:SemanticException Unable to determine if hdfs://**** is encrypted:java.lang.IllegalArgumentExcetion...(发布于2020-01-23 22:54:47)