欢迎投稿

今日深度:

分享一个SQLSERVER脚本(1)(2)

说一下两种方法的区别:

第一种方法是效率高,当表有上亿条记录的时候,如果你使用第二种方法执行AVG(DATALENGTH(C0))是很慢的,因为SQLSERVER要统计字段大小信息。

可能十几分钟都出不来结果。

当然,第一种方法也有一些缺陷,就是当表的记录数少的时候,统计出来的每行记录占用空间是不准确的。

因为datainfo这个值是以数据页大小为单位的,因为就算表只有一条记录,那么也会占用一个数据页8KB)

那么当8KB/1 =8KB,一条记录肯定不会是8KB大小的,所以记录少的时候会不准确。

但是当记录数很多的时候,就准确了。

看一下TB106这个表统计出来的结果值

  1. SELECT AVG(DATALENGTH(C0))+AVG(DATALENGTH(C1))+AVG(DATALENGTH(C2))+AVG(DATALENGTH(C3)) FROM [dbo].[TB106] 

可以看到是比较准确的

注意:

无论方法一还是方法二都不包括索引所占用的空间 !!


总结

大家平时一定会想:究竟DBA有什么作用?

在这里就给大家一个例子了,在工作中,程序员是不会关心他要查询的数据的大小的,他不管三七二十一只要把数据select出来就行了,然后收工。

DBA这里就要解决数据查询不出来的问题,一般的程序员觉得查询500条数据是很少的,根本不会关心表设计,表的字段的数据类型。

当工作越来越多,开发任务越来越重的时候更是这样。

所以本人觉得DBA这个角色还是比较重要的o(∩_∩)o 

如有不对的地方,欢迎大家拍砖o(∩_∩)o 

2014-7-7 脚本bug修复

由于算出来每行记录的精度有问题,我又对脚本的精度进行了改进

  1. CREATE TABLE #tablespaceinfo  
  2.     (  
  3.       nameinfo VARCHAR(50) ,  
  4.       rowsinfo BIGINT ,  
  5.       reserved VARCHAR(20) ,  
  6.       datainfo VARCHAR(20) ,  
  7.       index_size VARCHAR(20) ,  
  8.       unused VARCHAR(20)  
  9.     )    
  10.    
  11. DECLARE @tablename VARCHAR(255);    
  12.    
  13. DECLARE Info_cursor CURSOR 
  14. FOR 
  15.     SELECT  '[' + [name] + ']' 
  16.     FROM    sys.tables  
  17.     WHERE   type = 'U';    
  18.    
  19. OPEN Info_cursor    
  20. FETCH NEXT FROM Info_cursor INTO @tablename    
  21.    
  22. WHILE @@FETCH_STATUS = 0  
  23.     BEGIN   
  24.         INSERT  INTO #tablespaceinfo  
  25.                 EXEC sp_spaceused @tablename    
  26.         FETCH NEXT FROM Info_cursor    
  27.     INTO @tablename    
  28.     END   
  29.    
  30. CLOSE Info_cursor    
  31. DEALLOCATE Info_cursor    
  32.    
  33. --创建临时表  
  34. CREATE TABLE [#tmptb]  
  35.     (  
  36.       TableName VARCHAR(50) ,  
  37.       DataInfo BIGINT ,  
  38.       RowsInfo BIGINT ,  
  39.       Spaceperrow  AS ( CASE RowsInfo  
  40.                          WHEN 0 THEN 0  
  41.                          ELSE CAST(DataInfo AS decimal(18,2))/CAST(RowsInfo AS decimal(18,2))  
  42.                        END ) PERSISTED  
  43.     )  
  44.  
  45. --插入数据到临时表  
  46. INSERT  INTO [#tmptb]  
  47.         ( [TableName] ,  
  48.           [DataInfo] ,  
  49.           [RowsInfo]  
  50.         )  
  51.         SELECT  [nameinfo] ,  
  52.                 CAST(REPLACE([datainfo], 'KB'''AS BIGINTAS 'datainfo' ,  
  53.                 [rowsinfo]  
  54.         FROM    #tablespaceinfo  
  55.         ORDER BY CAST(REPLACE(reserved, 'KB'''AS INTDESC    
  56.  
  57.  
  58. --汇总记录  
  59. SELECT  [tbspinfo].* ,  
  60.         [tmptb].[Spaceperrow] AS '每行记录大概占用空间KB)' 
  61. FROM    [#tablespaceinfo] AS tbspinfo ,  
  62.         [#tmptb] AS tmptb  
  63. WHERE   [tbspinfo].[nameinfo] = [tmptb].[TableName]  
  64. ORDER BY CAST(REPLACE([tbspinfo].[reserved], 'KB'''AS INTDESC    
  65.  
  66. DROP TABLE [#tablespaceinfo]  
  67. DROP TABLE [#tmptb] 

本文出自:http://www.cnblogs.com/lyhabc/p/3828496.html


www.htsjk.Com true http://www.htsjk.com/shujukujc/19369.html NewsArticle 说一下两种方法的区别: 第一种方法是效率高,当表有上亿条记录的时候,如果你使用第二种方法执行AVG(DATALENGTH(C0))是很慢的,因为SQLSERVER要 统计 字段...
评论暂时关闭