欢迎投稿

今日深度:

Hive的“rowid”,

Hive的“rowid”,


玩过Oracle的同学一定知道rowid=objectid+file#+block#+row#这个概念,其实在Hive里也有“Rowid.

Hive里有虚拟列的概念,类似于Oracle里的伪列,其中三个虚拟列是:INPUT__FILE__NAMEBLOCK__OFFSET__INSIDE__FILEROW__OFFSET__INSIDE__BLOCK.

INPUT__FILE__NAME:MAPREDUCE读取的文件的URI

BLOCK__OFFSET__INSIDE__FILEFor blockCompressed files,表示RCFile Block orSequenceFile 当前块在文件中的偏移量;For non-block-compressedfiles, 表示当前行的偏移量.

ROW__OFFSET__INSIDE__BLOCK:当打开参数hive.exec.rowoffset(默认关闭)时会开启这个虚拟列特性,For non-block-compressed files这个值一直为0,否则表示行号.



本文转自MIKE老毕 51CTO博客,原文链接:http://blog.51cto.com/boylook/1336763,如需转载请自行联系原作者



www.htsjk.Com true http://www.htsjk.com/hive/35561.html NewsArticle Hive的“rowid”, 玩过 Oracle 的同学一定知道 rowid=objectid+file#+block#+row# 这个概念 , 其实在 Hive 里也有“ Rowid ” . Hive 里有虚拟列的概念,类似于 Oracle 里的伪列,其中三个虚拟列是: IN...
相关文章
    暂无相关文章
评论暂时关闭