欢迎投稿

今日深度:

Teradata SQL 笔记,

Teradata SQL 笔记,


HELP 帮助用户了解数据库中各种对象的结构 
SHOW 帮助用户了解某种对象的定义,即返回其DDL语句 
EXPLAIN 返回一个SQL语句经优化处理后的执行步骤,注意并未真正执行 
FALLBACK 对数据加以保护的一种方式,是冗余的备份 
RENAME 对表重命名 
NULLIFZERO 对数据作累计处理时,忽略零值 
ZEROIFNULL 对数据作累计处理时,将空值作零处理 
WITH...BY 对详细数据记录作分类统计(Sub-Total)时有用 
MODIFY USER/DATABASE  对用户/数据库对象作动态修改而无需数据库重组 


HELP  命令     参数           说明 
HELP DATABASE databasename;  可以显示一个指定数据库所包含的所有对象 
HELP USER username;  显示某个用户中所包含对象的信息 
HELP TABLE tablename;  显示某张表的信息 
HELP VIEW viewname;  显示某个视图的信息 
HELP MACRO macroname;  显示某个宏的信息 
HELP COLUMN table or viewname.*;  显示表/视图的各列的信息 
HELP COLUMN table or viewname.colname . . ., colname;  显示表/视图某几列的信息 
HELP INDEX tablename;  显示某个表中的所有索引定义 
HELP STATISTICS tablename;  显示表的统计 
HELP CONSTRAINT table or viewname.constraintname;  显示定义在某个表/视图上的约束定义 
HELP JOIN INDEX join_indexname;  显示连接索引的定义 
HELP TRIGGER triggername;  显示触发器的信息 
HELP PROCEDURE procedurename;  显示存储过程的信息 
HELP PROCEDURE procedurename ATTRIBUTES; 
HELP 'SQL';  得到所有SQL命令的列表信息 
HELP 'SQL sqlcommand';  得到某个特定SQL命令的使用方法 


如要知道这些数据库对象是用什么样的DDL命令创建的,则要使用SHOW命令: 
SHOW命令 参数 
SHOW TABLE Tablename ; 
SHOW VIEW Viewname; 
SHOW MACRO Macroname; 
SHOW INDEX Tablename; 
SHOW JOIN INDEX join_indexname; 
SHOW TRIGGER Triggername; 
SHOW PROCEDURE Procedurename; 



EXPLAIN命令:利用EXPLAIN命令,可以了解Teradata执行一个SQL交易请求的详细过程和计划,这对于更进一步地理解Teradata的查询处理机制有很大的帮助。另一方面,对于复杂SQL交易的调试来说,这也是不可缺少的一个工具。 

利用EXPLAIN解释一个SQL交易的方法很简单,就是在原来SQL语句的前面加上EXPLAIN即可,其它完全不变。 


在LIKE结构的字符串中,'%'和'_'可以作为通配符使用,但是如果需要匹配这些字符本身(比如查找95%),即把它们作为一般字符时使用,我们可以通过定义ESCAPE字符来达到这个目的,紧跟在ESCAPE字符后的’%’和’_’作为一般字符看待。 

例: 
LIKE ''%A%%AAA__'' ESCAPE ''A'' 

在这个表达式中,将字母A定义为ESCAPE字符,其中: 
! 第一个%为通配符; 
! 第一个A和其后的%联合表示字符%; 
! 第三个%为通配符; 
! 第二个A和其后的A联合表示字符A; 
! 第四个A和其后的’_’联合表示字符_; 
! 最后一个’_’为通配符。 


对于表达式的操作数如果是字符,ANSI标准中是区分大小写的,如果不要区分大小写,可以使用UPPER函数将其转换成大写字母来进行匹配。Teradata缺省不区分大小写,如果要区分,可以使用其扩展参数CASESPECIFIC。 


NULL的使用 

NULL的说明: 
! NULL显示没有数据的字段 
! NULL表示不存在或未发现的值 
! NULL既不是数字类型也不是字符类型 
! 具有NULL值的字段可以被压缩,不占任何空间 

NULL也可以参与运算,其运算规则为: 
! NULL在算术运算中产生的结果为NULL(空) 
! NULL在比较运算中产生的结果为False 
! UNKNOWN DATA, MISSING DATA和NULL是同样的含义 
! 当进行升序排列时,NULL在数字列排列在负数前,在字符列排列在空格 
前。 


宏 

CREATE MACRO macroname AS ( . . . );  定义宏 
EXECUTE macroname;  执行宏语句 
SHOW MACRO macroname;  显示宏定义 
REPLACE MACRO macroname AS ( . . . );  改变宏定义 
DROP MACRO macroname;  从字典中删除宏定义 
EXPLAIN EXEC macroname;  显示宏执行的解释 


EXISTS在子查询中的使用 

EXISTS可以使用在子查询中,用来表示查询至少返回一行。如果前面加上否定词NOT,则表示查询时无记录存在。EXISTS可以代替IN,而NOT EXISTS可以代替NOT IN。 


CHARACTERS函数 

CHARACTERS函数也是Teradata的扩展,用于计算VARCHAR型数据字段的实际字符串长度。CHARACTERS函数可以简写成CHARACTER、CHARS或者CHAR。 


TRIM函数 

ANSI标准的TRIM函数用于去除字符数据中前头或后端的空格或者二进制数据(BYTE与VARBYTE)中前头或后端的零。在Teradata缺省模式下,TRIM (<expression>)只能去除后端的空格或二进制零。 


SELECT CAST (salary_amount AS FORMAT '' $, 9.99''); 

SELECT (1000/salary_amount) * 100 
(FORMAT 'ZZ9%') 
(TITLE 'Increase Percentage') 
FROM employee 
WHERE employee_number = 1004; 

SELECT (CAST (1000/salary_amount) * 100 AS FORMAT 'ZZ9%' 
TITLE 'Increase Percentage') FROM ... 

FORMAT短语中可以使用的格式化字符主要为: 
$ 美元标识符 
9 数字位 
Z 将数字中的前缀零去除 
, 在指定位置插入逗号 
. 指定小数点位置 
- 在指定位置插入连字号 
/ 在指定位置插入斜线 
% 在指定位置插入百分号 
X 字符数据,每个X代表一个字符 
G 图形数据.一个G代表一个逻辑字符(双字节) 
B 在指定位置插入空格 


对日期的格式化处理 

在Teradata中,日期数据的缺省输出格式是:YY/MM/DD,这和ANSI标准是一样的。而ANSI标准建议的日期显示格式是:YYYY-MM-DD。 

其它一些常用的日期显示格式列举如下,其中的B表示空格。 
   YYYY/MM/DD' 
   YYYY-MM-DD' 
   YYYY.DDD' 
   DBMMMBYYYY' 
   MMBDD,BYYYY' 
   YYYYBMMMBDD' 
   YY/MM/DD' 
   D-MM-YY' 
   YBDDD' 
   MM' 

下面是一些对日期进行格式化的例子。 
   句法                        结果 
   FORMAT 'YYYY/MM/DD'         1996/03/27 
   FORMAT 'DDbMMMbYYYY'        27 Mar 1996 
   FORMAT 'mmmBdd,Byyyy'       Mar 27, 1996 
   FORMAT 'DD.MM.YYYY'         27.03.1996 
   FORMAT 'MM/DD/YY'           03/27/96 
   FORMAT 'MMM.DD.YY'          Mar.27.96 
   FORMAT 'yy -- mm -- dd'     96 -- 03 -- 27 
   FORMAT 'DDDYY'              08696 

SELECT last_name,first_name,hire_date (FORMAT 'mmmBdd,Byyyy') 
FROM employee 
ORDER BY last_name; 

利用FORMAT短语,可以将字符字段或表达式进行截取处理,这种处理只影响显示格式,而不会影响数据的内部存储格式。 


Teradata的属性函数 

属性函数     返回信息说明 
TYPE         数据类型 
TITLE        标题短语 
FORMAT       格式短语 
NAMED        NAMED子句 
CHARACTERS   字符个数 


Teradata DDL允许在创建表时指定表的物理属性,包括: 
   A. SET 不允许记录重复,例:CREATE SET TABLE table1 ... 
   B. MULTISET 允许记录重复,例:CREATE MULTISET TABLE table1 ... 
   C. 数据保护要结合FALLBACK和JOURNAL (流水或日志)。 
      FALLBACK是Teradata的一种数据保护机制,数据表的每一条记录都同时存放两份,而且位于不同的AMP所控制的存储单元中;当数据发生问题或者AMP失败时,可以利用存放在其他AMP上的数据保证对数据表的访问。 
        - FALLBACK 使用FALLBACK保护机制 
        - NO FALLBACK 不使用FALLBACK保护机制 
      日志有BEFORE和AFTER两种,分别保存了一条记录变化前后的状态。当系统出错时,可以利用日志进行恢复。 
   D. 存储空间选项 
      DATABLOCKSIZE用来指定数据块大小,最小的数据块为6144字节,最大的数据块是32256字节。 
      FREESPACE用来定义在每个磁盘柱面上保留的空间(0-75%)。 
   例: 
      CREATE MULTISET TABLE table_1 
      , FALLBACK, NO JOURNAL 
      , FREESPACE = 10 PERCENT 
      , DATABLOCKSIZE = 16384 BYTES 
      (field1 INTEGER); 


虽然TD的DDL里有primary key,但是实际上存储在TD数据字典里的只有index: 
   A. 没有在CREATE TABLE时指定PI 
        IF 定义了PK,THEN PK = UPI 
        ELSE IF 存在定义为UNIQUE的字段, 
        THEN 第一个NIQUE的字段为UPI 
        ELSE 表中定义的第一个字段作为NUPI 
   B. CREATE TABLE时指定了PI 
        IF 定义了PK,THEN PK作为USI 
        AND为每一个定义为UNIQUE的字段建立一个USI 


新建一张表TB1,表结构与TB2一样,不需要数据。 
    Create table TB1 as TB2 with no data; 

使用子查询创建表,并选择所需的列。 
    CREATE TABLE emp1 AS(SELECT employee_number, department_number, salary_amount FROM employee) WITH NO DATA; 

往TB1表中装入TB2表的数据(也可以是有选择性的,需指定字段) 
    INSERT INTO TB1 SELECT * from TB2; 


交易完整性 
   在Teradata中,系统将保证一个交易的完整。怎样才算是一个交易呢,在Teradata中,根据其所处方式的不同在处理时也有所不同。在Teradata缺省模式下,以分号结束的每个SQL语句都是一个完整的交易,也可以使用BT (Begin Transaction)和ET (End Transaction)来显示地定义一个交易。下面看一个例子: 
   
   例: 

   缺省方式 
   .LOGON 
   INSERT row1; (txn #1) 
   INSERT row2; (txn #2) 
   .LOGOFF 

   用BT和ET显示定义交易 
   .LOGON 
   BT; 
   INSERT row1; (txn #1) 
   INSERT row2; 
   COMMIT WORK; 
   ET; 
   .LOGOFF 
   
   第一部分中有两个SQL语句,用分号结束,表示两个交易,任何一个失败不会影响另一个的执行。而第二部分用BT和ET显示地规定:在BT和ET之间的所有SQL是一个交易,只有最后的COMMIT WORK执行成功后,才会真正地更新数据库。执行过程中任何一个SQL语句失败,都会使整个交易失败,系统将自动进行恢复(Rollback)处理。 

   在ANSI方式下,必须进行显示地提交才能完成一个交易。 


利用WITH BY进行数据小计 

   WITH BY的主要特点包括: 
     A. 它为明细数据表创建分类小计。 
     B. 跟GROUP BY不同的是,WITH BY没有剔除明细记录,而是在明细记录后面按照分类增加小计行。 
     C. 可以允许多于一个字段进行小计,即小计当中可以嵌套小计。 
     D. 输出结果将根据BY后面的所有字段自动进行排序。 
     E. 它是Teradata的一个扩展特性。 

   举例: 
     1. WITH BY, WITH和ORDER BY的联合使用: 

        SELECT last_name AS NAME 
        ,salary_amount AS SALARY 
        ,department_number AS DEPT 
        FROM employee 
        WITH SUM (SALARY) BY DEPT 
        WITH SUM (SALARY) (TITLE 'GRAND TOTAL') 
        ORDER BY NAME; 

        结果如下: 
        NAME       SALARY    DEPT 
        Kanieski   29250.00   301 
        Stein      29450.00   301 
        ------------- 
        Sum (SALARY) 58700.00 
        Johnson    36300.00   401 
        Trader     37850.00   401 
        ------------- 
        Sum (SALARY) 74150.00 
        Ryan       31200.00   403 
        Villegas   49700.00   403 
        ------------- 
        Sum (SALARY) 80900.00 
        ------------- 
        GRAND TOTAL 213750.00 

     2. WITH和GROUP BY的联合使用: 

        SELECT department_number (TITLE 'dept_no') 
        ,SUM (salary_amount) 
        ,AVG (salary_amount) 
        FROM employee 
        GROUP BY department_number 
        WITH SUM (salary_amount) (TITLE 'GRAND TOTAL') 
        ,AVG (salary_amount) (TITLE '') 
        ORDER BY department_number; 

结果如下: 
        dept_no SUM (salary_amount) AVG (salary_amount) 
        301     58700.00            29350.00 
        401     74150.00            37075.00 
        403     80900.00            40450.00 
        --------------------- ---------------------- 
        GRAND TOTAL 213750.00 35635.00 


集合操作 

    集合操作主要包括:合并操作(UNION)、相交操作(INTERSECT)和排外操作(EXCEPT) 

    Teradata的集合操作与标准ANSI集合操作的不同之出在于返回结果的重复记录处理上。在ANSI标准中集合操作将重复记录自动剔除,而Teradata增加了ALL关键词,ALL关键词允许保留重复记录。 

    我们将有关集合操作的一些补充规则列举如下: 
      1. 在子查询中不能使用集合操作 
      2. 在定义视图时不能使用集合操作 
      3. 不能包含WITH或WITH BY子句 
      4. 集合操作的优先级为:INTERSECT第一,其后分别为UNION和 EXCEPT,从左到右。可以使用括号改变优先级。 
      5. 每一个SELECT语句必须有一个FROM <表名>的子句 
      6. 每个单独的SELECT语句中可以使用GROUP BY 
      7. Group By不能用于或影响整个返回结果集 
      8. 重复记录将会抛弃,除非使用ALL选项 


字符串函数 

    SUBSTRING函数:用来从字符串中析取一个子字符串,其格式为: 
    SUBSTRING (<字符串表达式> FROM <开始位置> [ FOR <长度> ]) 
    如: 
    SELECT SUBSTRING('catalog' FROM 5 FOR 3); 
    结果为log。 

    字符串合并:字符串合并的符号是"||",它把两个字符串串联成一个字符串。其基本格式为: 
    <字符串1> || <字符串2> 

    INDEX (字符串定位函数):INDEX用来在一个字符串中定位一个子串的开始位置。如下面的例子: 
    SELECT INDEX('abc', 'b'); 返回结果2 


CASE 表达式 

    A. 基于值(Valued)的CASE语句,例如: 
       SELECT SUM( 
       CASE department_number 
       WHEN 401 THEN salary_amount 
       ELSE 0 
       END) / SUM(salary_amount) 
       FROM employee; 

    B. 基于搜索(Searched)的CASE语句,例如: 
       SELECT last_name, 
       CASE 
       WHEN salary_amount < 30000 
       THEN 'Under $30K' 
       WHEN salary_amount < 40000 
       THEN 'Under $40K' 
       WHEN salary_amount < 50000 
       THEN 'Under $50K' 
       ELSE 
       'Over $50K' 
       END 
       FROM employee 
       ORDER BY salary_amount; 

    C. NULLIF表达式 
       NULLIF实际上用来作为CASE语句在某种情况下的缩写,其格式为: 
       NULLIF ( <expression1> , <expression2> ) 
       规则是: 
           如果表达式1等于表达式2,则返回NULL 
           如果表达式1不等于表达式2,则返回表达式1的值。 
       例: 
           SELECT call_number 
           ,labor_hours (TITLE 'ACTUAL HOURS') 
           ,NULLIF (labor_hours, 0) 
           (TITLE 'NULLIF ZERO HOURS') 
           FROM call_employee 
           ORDER BY labor_hours; 

注意:在除法表达式中,如果被除数有可能为零值,经常使用NULLIF来避免除零错。 

     D. COALESCE(接合)表达式 
        COALESCE实际上也是CASE语句在某种特殊情况下的宿写。COALESCE将返回第一个非NULL表达式的值。其格式为: 
COALESCE ( <expression1> , <expression2> [, <expressionX> ] ) 

例:从phone_table表中,列出姓名和电话号码,如果办公室电话存在则列出办公室电话,否则列出家里电话。 
            SELECT name 
            ,COALESCE (office_phone, home_phone) 
            FROM phone_table; 

        例:转换可能的NULL值为零: 
            SELECT course_name 
            ,COALESCE (num_students, 0) 
            (TITLE '# Students') 
            FROM class_schedule; 


简单排队RANK 
    排队函数(RANK)的语法是: 
    RANK(colname) 
    这里,colname表示排队的列名,其结果降序排列。 
    问题 
       显示商店1001的产品销售额排队。 
    解答 
       SELECT storeid, prodid, sales, RANK(sales) 
       FROM salestbl 
       WHERE storeid = 1001; 
    结果 
       storeid    prodid    sales        Rank 
       1001       F         150000.00    1 
       1001       A         100000.00    2 
       1001       C         60000.00     3 
       1001       D         35000.00     4 
    如上所示,列Rank的最大值代表最低的销售额。 


带限定的排队 
    QUALIFY子句限制排队输出的最终结果。QUALIFY子句与HAVING子句类似,使输出限制在一定范围内。 
    问题 
       按商店得到销售前3名的产品。 
    解答 
       SELECT storeid, prodid, sales, rank(sales) 
       FROM salestbl 
       GROUP BY storeid 
       QUALIFY rank(sales) <= 3; 
    结果 
       storeid   prodid    sales       Rank 
       1001      A         100000.00   1 
       1001      C         60000.00    2 
       1001      D         35000.00    3 
       1002      A         40000.00    1 
       1002      C         35000.00    2 
       1002      D         25000.00    3 
       1003      B         65000.00    1 
       1003      D         50000.00    2 
       1003      A         30000.00    3

www.htsjk.Com true http://www.htsjk.com/teradata/37342.html NewsArticle Teradata SQL 笔记, HELP 帮助用户了解数据库中各种对象的结构  SHOW 帮助用户了解某种对象的定义,即返回其DDL语句  EXPLAIN 返回一个SQL语句经优化处理后的执行步骤,注意并未真正执行...
相关文章
    暂无相关文章
评论暂时关闭