发生滚动式灾难时,需要手动定额磁盘覆盖。在少数情况下,系统受到称为滚动式灾难的事件的影响。当事件范围较广时会发生滚动式灾难,并且其影响波及很长时间段内的多个步骤。以下示例场景描述了滚动式灾难并演示如何从该滚动式灾难恢复。

当出现以下情况时发生滚动式灾难的示例:
  1. 两个站点之间的链接失败,此时一个站点使用自动定额功能来继续执行操作。
  2. 控制定额磁盘的系统站点失败(例如,由于电源中断)。

此示例将第二个站点保留为可能是能够继续执行数据 I/O 的唯一站点;但是,直到该站点获得定额磁盘的控制权之后,才能这样做。第二个站点中的 MDisk 将停止。站点中的节点将显示节点错误 551,以指示没有足够的节点数可用于构成HyperSwap 系统配置中的定额磁盘。

在此方案中,您可以运行 satask overridequorum 命令以覆盖自动定额磁盘选择并创建包含第二个站点中节点的新系统。
Note: 如果在运行 satask overridequorum 命令时光纤网损坏,那么很可能节点的子集将更新其集群(系统)标识。 已更新的节点显示节点错误 550,未更新的节点显示错误 551,这些节点将分配到两个不同系统。在此情况下,您可以对报告错误 551 的其中一个节点再次运行 satask overridequorum 命令。 此命令会更新具有新集群(系统)标识的两个系统中的所有节点。 然后,您可以恢复数据。

定额磁盘的强制执行条件

必须在系统安装过程中运行 chsystem -topology hyperswap 命令,以使 satask overridequorum 命令在发生滚动式灾难的情况下可用。satask overridequorum 命令在未将拓扑设置为 hyperswap 的系统中不可用。在您可以使用此命令之前,必须满足以下先决条件。

  • 具有两个节点的所有 I/O 组将通过站点 1 中一个节点和站点 2 中另一个节点进行分配。
  • 具有 MDisk 的所有存储系统必须定义其站点。

当满足这些先决条件并且启用了自动定额磁盘选择时,系统会尝试在全部三个站点内分配一个定额磁盘。如果某个站点中没有适合于定额磁盘的 MDisk,那么不会对该站点分配定额磁盘。

Note: 运行 chsystem -topology hyperswap 命令之后,不能变更任何控制器的站点分配,除非该控制器是只有非受管 MDisk 的新控制器。

也不允许将站点设置用于节点。需要此强制措施以确保系统正确运行,从而正确运行 satask overridequorum 命令。

当您运行 chsystem -topology standard 命令时,可重新变更节点和控制器的站点设置。但是,此命令会禁用覆盖定额功能。因此,当您完成更改以重新启用此支持之后,要运行 chsystem -topology hyperswap