欢迎投稿

今日深度:

hive数据仓库新增字段方法,

hive数据仓库新增字段方法,


目录
  • 新增字段
    • 1、方法1
    • cascade知识
    • 2、方法2 (适用于外部表)
    • 3、方法3(下下策)
  • 修改字段
    • 删除列

      新增字段

      1、方法1

      alter table 表名 add columns (列名 string COMMENT '新添加的列') CASCADE;
      alter table 表名 add columns (列名 string COMMENT '新添加的列');
      hive表中指定位置增加一个字段
      分两步,先添加字段到最后(add columns),然后再移动到指定位置(change)
      alter table 表名 add columns (列名 string comment '当前时间'); -- 正确,添加在最后
      alter table 表名 change 列名 string after 指定位置的列名; -- 正确,移动到指定位置,address字段的后面

      添加之后字段由于hive底层是文件和系列化的设计,因此查数据会发现新增的列在所有已有列的后面

      CASCADE会刷历史分区字段

      cascade知识

      • cascade的中文翻译为“级联”,也就是不仅变更新分区的表结构(metadata),同时也变更旧分区的表结构。
      • 对于删除操作也是,级联删除表中的信息,当表A中的字段引用了表B中的字段时,一旦删除B中该字段的信息,表A的信息也自动删除。(当父表的信息删除,子表的信息也自动删除)
      • 标准语法如下:

      2、方法2 (适用于外部表)

      当分区过多的情况下,直接使用alter就行增加字段会报错

      第一步:删除分区 ,当分区过多可以写个for循环

      alter table table_name drop if exists partition(par_col=col_name)

      第二步:使用alter操作就行添加字段,这时候就不会因为分区过多报错

      第三步:进行修复分区

      msck repair table 表名;

      3、方法3(下下策)

      创建新表修改表名,进行存储原表数据

      将原表进行drop,再对新表进行改名操作

      ALTER TABLE old_name RENAME TO new_name;

      修改字段

      alter table table_name change column 已有列 修改名称 类型 comment '';

      删除列

      Hive不能直接删除列,不然底层系列化就乱了,我们可以通过replace语句来替换整张表的字段,达到同样的效果

      alter table table_name replace columns(column_1 string);

      语句中只写想要保留的字段就可以

      以上就是hive中新增字段方法的详细内容,更多关于hive新增字段的资料请关注PHP之友其它相关文章!

      您可能感兴趣的文章:
      • clickhouse 批量插入数据及ClickHouse常用命令详解
      • dataGrip显示clickhouse时间字段不正确的问题
      • shell命令执行hive脚本(hive交互)
      • Hive-SQL查询连续活跃登录用户思路详解
      • Clickhouse系列之整合Hive数据仓库示例详解

      www.htsjk.Com true http://www.htsjk.com/shujukunews/45241.html NewsArticle hive数据仓库新增字段方法, 目录 新增字段 1、方法1 cascade知识 2、方法2 (适用于外部表) 3、方法3(下下策) 修改字段 删除列 新增字段 1、方法1 alter table 表名 add columns (列名 strin...
      评论暂时关闭