欢迎投稿

今日深度:

Transactional replication(事务复制)详解之如何跳过

Transactional replication(事务复制)详解之如何跳过一个事务,transactional


在transactional replication, 经常会遇到数据同步延迟的情况。有时候这些延迟是由于在publication中执行了一个更新,例如update ta set col=? Where ?,这个更新包含巨大的数据量。在subscription端,这个更新会分解成多条命令(默认情况下每个数据行一个命令),应用到subscription上。 不得已的情况下,我们需要跳过这个大的事务,让replication继续运行下去。

现在介绍一下transactional replication的一些原理和具体的方法

当publication database的article发生更新时, 会产生相应的日志,Log reader会读取这些日志信息,将他们写入到Distribution 数据库的msrepl_transactions和msrepl_commands中。 

Msrepl_transactions中的每一条记录都有一个唯一标识xact_seqno,xact_seqno对应日志中的LSN。 所以可以通过xact_seqno推断出他们在publication database中的生成顺序,编号大的生成时间就晚,编号小的生成时间就早。

Distributionagent包含两个子进程,reader和writer。 Reader负责从Distribution 数据库中读取数据,Writer负责将reader读取的数据写入到订阅数据库.

reader是通过sp_MSget_repl_commands来读取Distribution数据库中(读取Msrepl_transactions表和Msrepl_Commands表)的数据

下面是sp_MSget_repl_commands的参数定义

CREATE PROCEDURE sys.sp_MSget_repl_commands 

( 

@agent_id int, 

@last_xact_seqno varbinary(16), 

@get_count tinyint = 0, -- 0 = no count, 1 = cmd and tran (legacy), 2 = cmd only 

@compatibility_level int = 7000000, 

@subdb_version int = 0, 

@read_query_size int = -1 

) 

这个存储过程有6个参数,在Transactional replication 中,只会使用前4个(并且第三个参数和第四个参数的值是固定不变的.分别为0和10000000)。下面是一个例子:

execsp_MSget_repl_commands 46,0x0010630F000002A900EA00000000,0,10000000

@agent_id表示Distributionagentid,每个订阅都会有一个单独的Distributionagent来处理数据。 带入@agent_id后,就可以找到订阅对应的publication 和所有的article。

@last_xact_seqno 表示上一次传递到订阅的LSN。

大致逻辑是:Reader读取subscription database的MSreplication_subscriptions表的transaction_timestamp列,获得更新的上一次LSN编号,然后读取分发数据库中LSN大于这个编号的数据。 Writer将读取到的数据写入订阅,并更新MSreplication_subscriptions表的transaction_timestamp列。然后Reader会继续用新的LSN来读取后续的数据,再传递给Writer,如此往复。

如果我们手工更新transaction_timestamp列,将这个值设置为当前正在执行的大事务的LSN,那么distribution agent就会不读取这个大事务,而是将其跳过了。

下面以一个实例演示一下

环境如下

Publisher: SQL108W2K8R21

Distributor: SQL108W2K8R22

Subscriber: SQL108W2K8R23

图中高亮的publication中包含3个aritcles,ta,tb,tc

其中ta包含18,218,200万数据,然后我们进行了一下操作

在11:00进行了更新语句,

update ta set c=-11

后续陆续对表ta,tb,tc执行一些插入操作

insert tb values(0,0)

insert tc values(0,0)

之后我们启动replication monitor ,发现有很大的延迟,distribution agent一直在传递a)操作产生的数据

在subscription database中执行下面的语句,得到当前最新记录的事务编号

declare @publisher sysname 

declare @publicationDB sysname 

declare @publication sysname 

set @publisher='SQL108W2K8R22' 

set @publicationDB='pubdb' 

set @publication='pubdbtest2'

select transaction_timestamp From MSreplication_subscriptions 

where 

publisher=@publisher and 

publisher_db=@publicationDB and 

publication=@publication 

在我的环境中,事务编号为0x0000014900004E9A0004000000000000

返回到distribution database,执行下面的语句,得到紧跟在大事务后面的事务编号. 请将参数替换成您实际环境中的数据。(请注意,如果执行下列语句遇到性能问题,请将参数直接替换成值)

declare @publisher sysname 

declare @publicationDB sysname 

declare @publication sysname 

declare @transaction_timestamp [varbinary](16) 

set @publisher='SQL108W2K8R21' 

set @publicationDB='publicationdb2' 

set @publication='pubtest' 

set @transaction_timestamp= 0x0000014900004E9A0004000000000000

select top 1 xact_seqno from MSrepl_commands with (nolock) where xact_seqno>@transaction_timestamp and 

article_id in ( 

  select article_id From MSarticles a inner join MSpublications p on a.publication_id=p.publication_id and a.publisher_id=p.publisher_id and a.publisher_db=p.publisher_db 

  inner join sys.servers s on s.server_id=p.publisher_id 

  where p.publication=@publication and p.publisher_db=@publicationDB and s.name=@publisher 

) 

and publisher_database_id =( 

    select id From MSpublisher_databases pd inner join MSpublications p on pd.publisher_id=p.publisher_id 

    inner join sys.servers s on pd.publisher_id=s.server_id and pd.publisher_db=p.publisher_db 

    where s.name=@publisher and p.publication=@publication and pd.publisher_db=@publicationDB 

) 

Order by xact_seqno

在我的环境中,事务编号为0x0000018C000001000171

在subscription database中执行下面的语句,跳过大的事务。请将参数替换成您实际环境中的数据

declare @publisher sysname

declare @publicationDB sysname 

declare @publication sysname 

declare @transaction_timestamp [varbinary](16) 

set @publisher='SQL108W2K8R22' 

set @publicationDB='pubdb' 

set @publication='pubdbtest2' 

set @transaction_timestamp= 0x0000018C000001000171

update MSreplication_subscriptions set transaction_timestamp=@transaction_timestamp 

where publisher=@publisher and publisher_db=@publicationDB and publication=@publication 

执行完成后开启distribution agent job即可。

接下来您就会发现,事务已经成功跳过,ta在订阅端不会被更新,后续的更新会逐步传递到订阅,延迟消失。


计算机专业英语词汇

电脑词汇 中英对照
作者: 发布时间:2007-04-24 17:15:23 来源:
________________________________________
All) level “(全部)”级别
action 操作
active statement 活动语句
active voice 主动语态
ActiveX Data Objects ActiveX 数据对象
ActiveX Data Objects (Multidimensional) (ADO MD) ActiveX 数据对象(多维)(ADO MD)
ad hoc connector name 特殊连接器名称
add-in 加载项
adjective phrasing 形容词句式
ADO ADO
ADO MD ADO MD
adverb 副词
aggregate function 聚合函数
aggregate query 聚合查询
aggregation 聚合
aggregation prefix 聚合前缀
aggregation wrapper 聚合包装
alert 警报
alias 别名
aliasing 命名别名
All member “全部”成员
American National Standards Institute (ANSI) 美国国家标准学会 (ANSI)
Analysis server 分析服务器
ancestor 祖先
annotational property 批注属性
anonymous subscription 匿名订阅
ANSI ANSI
ANSI to OEM conversion ANSI 到 OEM 转换
API API
API server cursor API 服务器游标
application programming interface (API) 应用程序接口 (API)
application role 应用程序角色
archive file 存档文件
article 项目
atomic 原子的
attribute 特性
authentication 身份验证
authorization 授权
automatic recovery 自动恢复
autonomy 独立
axis 轴
backup 备份
backup device 备份设备
backup file 备份文件
backup media 备份媒体
backup set 备份集
balanced hierarchy 均衡层次结构
base data type 基本数据类型
base table 基表
batch 批处理
bcp files bcp 文件
bcp utility bcp 实用工具
bigint data type bigint 数据类型
binary data type binary 数据类型
binary large object 二进制大对象
binding 绑定
bit data type bit 数据类型
bitwise operation 按位运算
BLOB BLOB
blocks 块
Boolean 布尔型
browse mode 浏览模式
built-in functions 内置函数
business rules 业务规则
cache aging 高速缓存老化数据清除
calculated column 计算列
cal......余下全文>>
 

计算机专业英语词汇

电脑词汇 中英对照
作者: 发布时间:2007-04-24 17:15:23 来源:
________________________________________
All) level “(全部)”级别
action 操作
active statement 活动语句
active voice 主动语态
ActiveX Data Objects ActiveX 数据对象
ActiveX Data Objects (Multidimensional) (ADO MD) ActiveX 数据对象(多维)(ADO MD)
ad hoc connector name 特殊连接器名称
add-in 加载项
adjective phrasing 形容词句式
ADO ADO
ADO MD ADO MD
adverb 副词
aggregate function 聚合函数
aggregate query 聚合查询
aggregation 聚合
aggregation prefix 聚合前缀
aggregation wrapper 聚合包装
alert 警报
alias 别名
aliasing 命名别名
All member “全部”成员
American National Standards Institute (ANSI) 美国国家标准学会 (ANSI)
Analysis server 分析服务器
ancestor 祖先
annotational property 批注属性
anonymous subscription 匿名订阅
ANSI ANSI
ANSI to OEM conversion ANSI 到 OEM 转换
API API
API server cursor API 服务器游标
application programming interface (API) 应用程序接口 (API)
application role 应用程序角色
archive file 存档文件
article 项目
atomic 原子的
attribute 特性
authentication 身份验证
authorization 授权
automatic recovery 自动恢复
autonomy 独立
axis 轴
backup 备份
backup device 备份设备
backup file 备份文件
backup media 备份媒体
backup set 备份集
balanced hierarchy 均衡层次结构
base data type 基本数据类型
base table 基表
batch 批处理
bcp files bcp 文件
bcp utility bcp 实用工具
bigint data type bigint 数据类型
binary data type binary 数据类型
binary large object 二进制大对象
binding 绑定
bit data type bit 数据类型
bitwise operation 按位运算
BLOB BLOB
blocks 块
Boolean 布尔型
browse mode 浏览模式
built-in functions 内置函数
business rules 业务规则
cache aging 高速缓存老化数据清除
calculated column 计算列
cal......余下全文>>
 

www.htsjk.Com true http://www.htsjk.com/Sql_Server/11590.html NewsArticle Transactional replication(事务复制)详解之如何跳过一个事务,transactional 在transactional replication, 经常会遇到数据同步延迟的情况。有时候这些延迟是由于在publication中执行了一个更新,例...
评论暂时关闭