欢迎投稿

今日深度:

Hive 函数,

Hive 函数,


Hive 函数

Hive 内置函数
1、内容较多,见《Hive 官方文档》
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF
2、测试内置函数的快捷方式:
第一种方式:直接使用,例如:select concat(‘a’,‘a’)  aa
第二种方式:
1、创建一个 dual 表 create table dual(id string);
2、load 一个文件(一行,一个空格)到 dual 表
3、select substr(‘huangbo’,2,3) from dual;
3、查看内置函数:
show functions;
显示函数的详细信息:
desc function abs;
显示函数的扩展信息:
desc function extended concat;
4、内置函数列表
一、关系运算:

  • 日期转年函数: year
  • 日期转月函数: month
  • 日期转天函数: day
  • 日期转小时函数: hour
  • 日期转分钟函数: minute
  • 日期转秒函数: second
  • 日期转周函数: weekofyear
  • 日期比较函数: datediff
  • 日期增加函数: date_add
  • 日期减少函数: date_sub
    十、条件函数
  • If 函数: if
  • 非空查找函数: COALESCE
  • 条件判断函数:CASE
    十一、字符串函数
  • 字符 ascii 码函数:ascii
  • base64 字符串
  • 字符串连接函数:concat
  • 带分隔符字符串连接函数:concat_ws
  • 数组转换成字符串的函数:concat_ws
  • 小数位格式化成字符串函数:format_number
  • 字符串截取函数:substr,substring
  • 字符串截取函数:substr,substring
  • 字符串查找函数:instr
  • 字符串长度函数:length
  • 字符串查找函数:locate
  • 字符串格式化函数:printf
  • 字符串转换成 map 函数:str_to_map
  • base64 解码函数:unbase64(string str)
  • 字符串转大写函数:upper,ucase
  • 字符串转小写函数:lower,lcase
  • 去空格函数:trim
  • 左边去空格函数:ltrim
  • 右边去空格函数:rtrim
  • 正则表达式替换函数:regexp_replace
  • 正则表达式解析函数:regexp_extract
  • URL 解析函数:parse_url
  • json 解析函数:get_json_object
  • 空格字符串函数:space
  • 重复字符串函数:repeat
  • 左补足函数:lpad
    1. 右补足函数:rpad
  • 分割字符串函数: split
  • 集合查找函数: find_in_set
  • 分词函数:sentences
  • 分词后统计一起出现频次最高的 TOP-K
  • 分词后统计与指定单词一起出现频次最高的 TOP-K
    十二、混合函数
  • 调用 Java 函数:java_method
  • 调用 Java 函数:reflect
  • 字符串的 hash 值:hash
    十三、XPath 解析 XML 函数
  • xpath
  • xpath_string
  • xpath_boolean
  • xpath_short, xpath_int, xpath_long
  • xpath_float, xpath_double, xpath_number
    十四、汇总统计函数(UDAF)
  • 个数统计函数: count
  • 总和统计函数: sum
  • 平均值统计函数: avg
  • 最小值统计函数: min
  • 最大值统计函数: max
  • 非空集合总体变量函数: var_pop
  • 非空集合样本变量函数: var_samp
  • 总体标准偏离函数: stddev_pop
  • 样本标准偏离函数: stddev_samp
  • 中位数函数: percentile
  • 中位数函数: percentile
  • 近似中位数函数: percentile_approx
  • 近似中位数函数: percentile_approx
  • 直方图: histogram_numeric
  • 集合去重数:collect_set
  • 集合不去重函数:collect_list
    十五、表格生成函数 Table-Generating Functions (UDTF)
    1.数组拆分成多行:explode(array)
    2.Map 拆分成多行:explode(map)
  • www.htsjk.Com true http://www.htsjk.com/hive/40752.html NewsArticle Hive 函数, Hive 函数 Hive 内置函数 1、内容较多,见《Hive 官方文档》 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF 2、测试内置函数的快捷方式: 第一种方式:直接使用,例如:...
    相关文章
      暂无相关文章
    评论暂时关闭