我要投稿

SQL Server误区30日谈第11天镜像在检测到故障后瞬间就能故障转移

Nice MsSql

2022-05-24 0 585

误区 #11:镜像在检测到故障后瞬间就能故障转移

错误

数据库镜像的故障转移既可以自动发起，也可以手动发起。

在自动发起的情况下,是由镜像服务器执行故障转移操作（你没有看错，并不是由见证服务器来做故障转移的决定）,在见证服务器和镜像服务器都发现无法和主体服务器交换信息(这个过程被称为”形成仲裁”,译者注:也就是通过程序对集群进行监管，集群可用的依据来自监管程序的算法，比如根据:每个节点的配置，文件共享情况，磁盘访问情况，每个节点的可用性等来确定集群是否可用)并且镜像方式是同步时，可以进行故障转移。(译者注：所谓的同步指的是主体服务器必须等待镜像服务器的日志写入后，才能够提交事务。相对异步来说性能更差，但更安全，并且还不需要SQL Server是企业版)。

手动故障转移是由你发起的,手动发起可能是由于不存在见证服务器(以至于无法“形成仲裁”)，或是在主体服务器现在问题时镜像的运行模式不是“同步”。

当主体服务器发生故障时，镜像服务器在日志队列Redo完成之前不会上线(所谓的日志队列就是由主体服务器传送到镜像服务器的日志，但还没有在镜像服务器Replay)。即使你镜像的运行模式是同步,也仅仅只能说明日志被写入镜像磁盘，但不能保证日志在镜像服务器被重放。而对于故障转移来说，镜像服务器必须经历Roll Forward阶段才能够上线.但Roll Back阶段是镜像上线后才会做的。

在SQL Server标准版以及企业版所在的CPU低于5个内核，Roll Forward只有一个线程。对于企业版并且CPU多余5核，为每4个核分配一个Roll Forward线程。所以完全可以看出故障转移所需的时间取决于需要对日志进行Redo处理的队列大小，CPU的核数，以及镜像服务器的负载。

由于大家都认为镜像工作在同步方式时可以迅速进行故障转移，所以很少有人检测日志Redo队列。但由于Redo队列的大小确定了故障转移时Downtime的大小，所以检测镜像服务器Redo队列变得十分重要。

有关这里更细节的文章，你可以参看:Estimating the Interruption of Service During Role Switching

收藏 (0) 点赞 (0)

免责声明：
1、本网站所有发布的源码、软件和资料均为收集各大资源网站整理而来;仅限用于学习和研究目的,您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。不得使用于非法商业用途，不得违反国家法律。否则后果自负！

2、本站信息来自网络，版权争议与本站无关。一切关于该资源商业行为与www.niceym.com无关。
如果您喜欢该程序，请支持正版源码、软件，购买注册，得到更好的正版服务。
如有侵犯你版权的，请邮件与我们联系处理（邮箱:skknet@qq.com），本站将立即改正。

NICE源码网 MsSql SQL Server误区30日谈第11天镜像在检测到故障后瞬间就能故障转移 https://www.niceym.com/61026.html