今日深度：

和通数据库 > hive > 正文

spark on hive，

和通数据库htsjk.Com2019-12-31 01:12 来源:未知阅读:14893 评论 472 热度5

标签：

spark on hive，

spark on hive

1、spark on hive介绍

（1）就是通过sparksql，加载hive的配置文件，获取到hive的元数据信息
（2）spark sql获取到hive的元数据信息之后就可以拿到hive的所有表的数据
（3）接下来就可以通过spark sql来操作hive表中的数据

2、spark on hive 配置

（1）将hive安装目录下conf/hive-site.xml拷贝到spark的conf目录下
（2）同时把hive安装目录下lib目录中的mysql驱动包，拷贝到spark的jars目录
（3）分发所有配置和拷贝mysql驱动到spark的其他节点
（4）启动spark-sql 就可以操作hive的sql语句了。
注意需要添加配置
- –conf spark.sql.warehouse.dir=hdfs://bigdata-1:9000/user/hive/warehouse

3、操作实例

执行命令：spark-sql –master spark://bigdata-1bigdata-1:7077 –executor-memory 1g –total–executor-cores 2 –conf spark.sql.warehouse.dir=hdfs://bigdata-1:9000/user/hive/warehouse
操作：
- show databases;

本站文章为和通数据库网友分享或者投稿，欢迎任何形式的转载，但请务必注明出处.
同时文章内容如有侵犯了您的权益，请联系QQ：970679559，我们会在尽快处理。

相关文章

暂无相关文章

评论暂时关闭