恢复系统配置

本过程用于在以下情况下恢复系统配置:仅当恢复系统过程失败,或者当不需要卷上所存储的数据时。

该配置恢复过程旨在恢复有关配置的信息,如卷、本地高速镜像信息、本地全局镜像信息、存储池和节点。 不会恢复已写入卷的数据。 要恢复卷上的数据,必须分别从任何在集群系统上将卷用作存储器的应用程序恢复应用程序数据。 因此,您必须具有该数据的备份,才能执行配置恢复过程。

如果在备份系统配置时对系统启用了 USB 加密,那么节点容器 USB 端口中至少插入了 3 个 USB 闪存驱动器才能恢复配置。 这 3 个 USB 闪存驱动器必须插入到将要运行配置复原命令的单个节点中。 其他节点(可能属于该系统)中的任何 USB 闪存驱动器都将被忽略。 如果不打算恢复云备份配置,USB 闪存驱动器无需包含任何密钥。 USB 设备在复原过程中用于生成新密钥。 如果要恢复云备份配置,USB 闪存驱动器必须包含之前的一组密钥,以允许解锁当前加密数据并使用新密钥进行再加密。

在 T4 恢复期间,会使用新证书创建新系统。 如果系统具有密钥服务器加密功能,那么必须使用 chsystemcert-export 命令导出新证书,然后将新证书安装到正确设备组中的所有密钥服务器上,之后再运行 T4 恢复。 使用的设备组即是定义先前系统的设备组。 可能还需要签署新系统的证书。 在 T4 恢复过程中,通知密钥服务器管理员现行密钥不安全。

您还必须定期备份配置数据和应用程序数据,以防止数据丢失。 如果发生严重故障之后系统丢失,那么系统配置和应用程序数据都会丢失。 必须将系统刚好恢复为故障之前的状态,然后恢复应用程序数据。

在恢复过程中,会将节点和存储机柜恢复到系统,然后会重新创建并配置 MDisk 和阵列。 如果涉及多个存储机柜,那么将基于机柜标识在适当机柜上恢复阵列和 MDisk。

Important:
  • 恢复过程中有两个阶段:准备和执行。 在这两个阶段之间不得更改光纤网或系统。
  • 对于所含节点连接到 iSCSI 虚拟化的外部控制器的系统,必须将所有节点添加到系统后才能复原数据。 此外,在复原数据之前,还必须手动重新应用系统 cfgportip 设置和 iSCSI 存储端口。请参阅步骤 #svc_clustconfrestoretsk_1e4k7g/iscsi
  • 针对 VMware vSphere 虚拟卷(有时称为 VVol)环境,在 T4 复原后,已完成部分虚拟卷配置步骤:已创建 metadatavdisk,已创建用户组和用户且已创建 adminlun 主机。 但是,用户接下来必须手动完成最后两个配置步骤(在 Spectrum Control Base Edition 上创建存储容器以及在 VMware vCenter 上创建虚拟机)。 请参阅配置虚拟卷
  • 复原系统配置应通过先前位于 I/O 组零中的某个节点执行。 例如,property name="IO_group_id" value="0" 。 如果需要,可以根据节点容器的先前 IO_group_id 按照相应顺序添加其余机柜。
  • 如果系统具有 USB 加密,请从系统中插入了加密密钥所在的 USB 闪存驱动器的任意节点运行恢复。
  • 如果系统具有密钥服务器加密,请在连接到该密钥服务器的节点上运行恢复。 将从密钥服务器远程访存密钥。
  • 如果系统同时使用 USB 和密钥服务器加密,那么提供 USB 闪存驱动器 或到密钥服务器的连接(只需提供一个,但同时提供两者也可以)即可将系统解锁。
  • 对于具有云备份配置的系统,在 T4 恢复期间,必须将包含原始系统的系统主密钥的 USB 钥匙插入新系统的配置节点中。 或者,如果使用了密钥服务器,那么该密钥服务器必须包含原始系统的系统主密钥。 如果原始系统主密钥不可用,且系统数据是在云提供者中加密的,那么无法访问云中的数据。
  • 如果系统包含使用 USB 和密钥服务器加密配置的加密云帐户,那么在执行 T4 恢复时将需要两者提供的主密钥。
  • 如果系统包含使用 USB 加密的加密云帐户,那么配置节点中必须存在具有系统主密钥的 USB 闪存驱动器,然后云帐户才能转变为联机状态。 当系统关闭电源,然后重新启动时,必须满足此需求。
  • 在 T4 恢复之后,云帐户处于脱机状态。 必须重新输入认证信息以使帐户恢复联机。
  • 如果使用 USB 闪存驱动器管理加密密钥,那么在未将 USB 闪存驱动器插入系统的情况下,T4 恢复操作会导致到云服务提供商的连接脱机。 要解决此问题,请将包含最新密钥的 USB 闪存驱动器插入系统。
  • 如果使用密钥服务器管理加密密钥,那么在密钥服务器脱机的情况下,T4 恢复会导致到云服务提供商的连接脱机。 要解决此问题,请确保密钥服务器处于联机状态,且在 T4 恢复期间可用。
  • 如果同时使用密钥服务器和 USB 闪存驱动器来管理加密密钥,那么在密钥服务器脱机时,T4 恢复会导致到云服务提供商的连接脱机。 要解决此问题,请确保在执行 T4 恢复期间,密钥服务器处于联机状态,且 USB 闪存驱动器已插入系统。
  • 在 T4 恢复后,在恢复之前启用云快照的卷需要手动重新启用云快照。

如果对运行 CLI 命令的指示信息不了解,请参阅命令行界面参考信息。

要恢复配置数据,请执行以下步骤:

  1. 在运行此恢复过程前,验证是否所有节点都可用作候选节点。 必须移除错误 550 或 578 才能将节点置于候选状态。 对于显示这些错误的所有节点,均请执行以下步骤:
    1. 将您的浏览器指向一个节点的服务 IP 地址(例如,https://node_service_ip_address/service/)。
    2. 登录服务助手。
    3. 页面,如果节点容器尚未处于服务状态,请使它进入服务状态。
    4. 选择 Manage System
    5. 单击 Remove System Data
    6. 提示时确认您要移除系统数据。
    7. 页退出服务状态。将移除 550 或 578 错误,并且节点显示为候选节点。
    8. 移除显示 550 或 578 错误的其他节点的系统数据。

      之前该系统中的所有节点都必须具有节点状态候选,并且未列出针对它们的错误。

      Note: 已断电的节点不会显示在系统的该节点列表中。使用服务助手 IP 地址并物理验证节点的硬件问题。
      Warning: 如果使用 管理 GUI 进行初始设置以复原系统配置,请检查是否已创建缺省回拨电子邮件用户。 如果已创建,请删除缺省回拨电子邮件用户,以使 T4 系统恢复能够顺利进行。
  2. 验证是否所有节点都可用作具有空白系统字段的候选节点。 对每个控制机柜中的一个节点均执行以下步骤:
    1. 连接到控制机柜中任一节点上的服务助手。
    2. 选择配置机柜
    3. 选择重置系统标识选项。 请勿在面板上进行任何其他更改。
    4. 单击修改
  3. 创建系统。
    • 对于 Lenovo Storage V7000Lenovo Storage V7000 系统,请使用技术人员端口。
  4. 在受支持的浏览器中,输入已用于初始化系统的 IP 地址以及缺省超级用户密码 (passw0rd)。
  5. 将显示设置向导。 请注意以下项:
    1. 接受许可协议。
    2. 设置系统名称、日期和时间设置以及系统许可的值。 在配置恢复过程中,将恢复原始设置。
    3. 验证硬件。 将仅显示在其上创建了集群系统的控制机柜以及直接连接的扩展机柜。 其他 I/O 组中的任何其他控制机柜和扩展机柜都将在稍后添加到系统。

    设置向导完成后,请勿再进行任何其他配置更改。

  6. 如果在设置向导中设置了电子邮件通知,现在必须移除该电子邮件用户和服务器,才能复原原始配置。
    发出以下 CLI 命令以移除新电子邮件用户:
    rmemailuser 0
    发出以下 CLI 命令以移除新电子邮件服务器:
    rmemailserver 0
  7. 管理 GUI,单击访问 > 用户并配置超级用户的 SSH 密钥。
  8. 缺省情况下,会在存储层中创建最新初始化的系统。 系统层不会自动从配置备份 XML 文件恢复。 如果您要恢复的系统先前是在复制层配置的,那么现在必须手动更改此层。 有关复制层和存储层的更多信息,请参阅页面底部的相关概念部分中的系统层主题。
  9. 如果集群系统之前配置为复制层,那么使用 chsystem 命令更改层设置。
  10. 对于具有多个 I/O 组的配置,通过使用 addcontrolenclosure CLI 命令,将其余控制机柜添加到集群系统中。
    可根据节点容器的先前 IO_group_id 按照相应顺序添加其余机柜。 以下示例显示将控制机柜添加到 I/O 组 2 的命令。
    svctask addcontrolenclosure-sernumSVT5M48-iogrp2
  11. 确定要从中进行复原的配置备份文件。

    该文件可以是备份配置时保存的配置备份 XML 文件的本地拷贝,也可以是节点之一上的最新文件。

    将在每天系统时间 01:00 自动备份配置节点上的配置数据。

    下载并检查先前系统中所有节点上的配置备份文件,确定包含最新完整备份的文件

    1. 管理 GUI,单击设置 > 支持 > 支持包
    2. 展开手动上载指示信息,然后选择下载支持包
    3. 下载新的支持包或日志文件页面中,选择下载现有包
    4. 对于系统中的每个节点(容器),请完成以下步骤:
      1. 从表顶部的选择框中选择要对其进行操作的节点。
      2. 查找名称与 svc.config.*.xml* 模式匹配的所有文件。
      3. 选择文件,然后单击下载以将其下载到计算机。
    这些 XML 文件包含可用于识别最新备份的日期和时间。 当确定要在恢复系统时使用的备份 XML 文件后, 请将该文件重命名为 svc.config.backup.xml
  12. 将要从中进行恢复的 XML 备份文件复制到系统上。
    pscp full_path_to_identified_svc.config.file 
    superuser@cluster_ip:/tmp/svc.config.backup.xml
  13. 如果系统包含任何 iSCSI 存储控制器,必须现在手动检测这些控制器。 必须先将连接到这些控制器的节点、iSCSI 端口 IP 地址以及 iSCSI 存储端口添加到系统,然后才能复原数据。
    1. 要添加这些节点,请从配置备份文件确定任何此类节点的面板名称、节点名和 I/O 组。 要将这些节点添加到系统,请运行以下命令:
      svctask addcontrolenclosure-iogrpiogrp_name_or_id-sernumenclosure_serial_number-sitesite_id

      其中,enclosure_serial_number 是控制机柜的序列号, iogrp_name_or_id 是要向其中添加此节点的 I/O 组的名称或标识,而 site_id 是控制机柜的数字站点值(1 或 2)。

    2. 运行以下命令以更改复制层。
      chsystem-layerreplication
    3. 要复原 iSCSI 端口 IP 地址,请使用 cfgportip 命令。
      1. 要从配置备份文件复原 IPv4 地址、确定 id (port_id)、node_id、node_name、IP_address、掩码、网关、主机(0/1 表示 no/yes)、remote_copy(0/1 表示 no/yes)和 storage(0/1 表示 no/yes),请运行以下命令:
        svctask cfgportip-nodenode_name_or_id-ipipv4_address-gwipv4_gw-hostyes | no-remotecopyremote_copy_port_group_id-storageyes | noport_id

        其中,node_name_or_id 是节点的名称或标识,ipv4_address 是端口的 IPv4 版本协议地址,ipv4_gw 是端口的 IPv4 网关地址。

      2. 要从配置备份文件复原 IPv6 地址、确定 id (port_id)、node_id、node_name、IP_address_6、掩码、gateway_6、prefix_6、host_6(0/1 表示 no/yes)、remote_copy_6(0/1 表示 no/yes)和 storage_6(0/1 表示 no/yes),请运行以下命令:
        svctask cfgportip-nodenode_name_or_id-ip_6ipv6_address-gw_6ipv6_gw-prefix_6prefix-host_6yes | no-remotecopy_6remote_copy_port_group_id-storage_6yes | noport_id

        其中,node_name_or_id 是节点的名称或标识,ipv6_address 是端口的 IPv6 版本协议地址,ipv6_gw 是端口的 IPv6 网关地址,prefix 是 IPv6 前缀。

      针对备份配置文件的 node_ethernet_portip_ip 节中的所有(先前配置的)IP 端口完成步骤 b.i 和 b.ii。

    4. 接下来,使用 detectiscsistorageportcandidateaddiscsistorageport 命令检测并添加 iSCSI 存储端口候选项。 请确保检测 iSCSI 存储端口,并按照在配置备份文件中看到的顺序添加这些端口。 如果不按照正确的顺序添加,可能会导致 T4 故障。 步骤 c.i 之后必须执行步骤 c.ii 和 c.iii。 必须严格按照相同的顺序对备份配置文件中列出的所有 iSCSI 会话重复这些步骤。
      1. 要从配置备份文件中检测 iSCSI 存储端口、确定 src_port_idIO_group_id(可选,值为 255 时不需要)、target_ipv4/target_ipv6(需要非空目标 IP)、iscsi_user_name(为空时不需要)、iscsi_chap_secret(为空时不需要)和 site(为空时不需要),请运行以下命令:
        svctask detectiscsistorageportcandidate-srcportidsrc_port_id-iogrpIO_group_id-targetip/targetip6target_ipv4/target_ipv6-usernameiscsi_user_name-chapsecretiscsi_chap_secret-sitesite_id_or_name

        其中,src_port_id 是配置端口的源以太网端口标识,IO_group_id 是正在检测的 I/O 组标识或名称,target_ipv4/target_ipv6 是 IPv4/IPv6 目标 iSCSI 控制器 IPv4/IPv6 地址,iscsi_user_name 是正在检测的目标控制器用户名,iscsi_chap_secret 是正在检测的目标控制器 CHAP 密码,site_id_or_name 是为正在检测的站点指定的标识或名称。

      2. 通过运行 lsiscsistorageportcandidate 命令,将发现的 target_iscsiname 与备份配置文件中此特定会话的 target_iscsiname 进行匹配,并使用匹配的索引在步骤 c.iii 中添加 iSCSI 存储端口。

        运行 svcinfo lsiscsistorageportcandidate 命令并确定 target_iscsiname 与配置备份文件中 target_iscsiname 匹配的行的 id 字段。 这是要在步骤 c.iii 中使用的 candidate_id

      3. 要从配置备份文件添加 iSCSI 存储端口、确定 IO_group_id(可选,值为 255 时不需要)、site(为空时不需要)、iscsi_user_name(备份文件中为空时不需要)和 iscsi_chap_secret(为空时不需要),请提供步骤 c.ii 中匹配的 target_iscsiname_index,然后运行以下命令:
        addiscsistorageport-iogrpiogrp_id-usernameiscsi_user_name-chapsecretiscsi_chap_secret-sitesite_id_or_namecandidate_id

        其中,iogrp_id 是添加的 I/O 组的标识或名称,iscsi_user_name 是要添加的目标控制器的用户名,iscsi_chap_secret 是要添加的目标控制器的 CHAP 密码,site_id_or_name 指定要添加的站点的标识或名称。

      4. 如果配置是 HyperSwap 或延伸系统,那么需要复原控 制器名称和站点。 要复原控制器名称和站点,通过将 inter_WWPN 字段与新添加的 iSCSI 控制器相匹配,确定备份 XML 文件 中的 controller_name 和控制器 site_id/name,然后运行以下命令:
        chcontroller-namecontroller_name-sitesite_id/namecontroller_id/name

        其中,controller_name 是备份 XML 文件中的控制器名称,site_id/name 是备份 XML 文件中 iSCSI 控制器站点的标识或名称 ,controller_id/name 是控制器的标识或当前名称。

  14. 发出以下 CLI 命令以将当前配置与备份配置数据文件进行比较:
    svcconfigrestore-prepare
    该 CLI 命令会在配置节点的 /tmp 目录中创建一个日志文件。 该日志文件的名称为 svc.config.restore.prepare.log
    Note: 至多需要一分钟才能发现各 256-MDisk 批次。 如果输入此命令后收到 MDisk 的错误消息 CMMVC6200W,那么表示可能还没有发现所有受管磁盘 (MDisk)。 适当稍等片刻,然后再次尝试 svcconfig restore -prepare 命令。
  15. 发出以下命令以将该日志文件复制到系统可访问的其他服务器:
    pscp superuser@cluster_ip:/tmp/svc.config.restore.prepare.log 
    full_path_for_where_to_copy_log_files
  16. 从当前存储该拷贝的服务器打开该日志文件。
  17. 查看该日志文件以查找错误。
  18. 发出以下 CLI 命令以恢复配置:
    svcconfigrestore-execute

    该 CLI 命令会在配置节点的 /tmp 目录中创建一个日志文件。 该日志文件的名称为 svc.config.restore.execute.log

  19. 发出以下命令以将该日志文件复制到系统可访问的其他服务器:
    pscp superuser@cluster_ip:/tmp/svc.config.restore.execute.log 
    full_path_for_where_to_copy_log_files
  20. 从当前存储该拷贝的服务器打开该日志文件。
  21. 查看该日志文件以确保没有出现任何错误或警告。
    Note: 您可能会收到一条警告,表明某个许可功能部件未启用。 该消息意味着在恢复过程之后,当前许可证设置与先前许可证设置不匹配。 恢复过程将正常继续,而您可以稍后在管理 GUI 中输入正确的许可设置。

    当通过 SSH 再次登录到 CLI 时,将看到以下输出:

    IBM_2076:your_cluster_name:superuser>
  22. 恢复配置后,通过使用 lsquorum 命令验证是否已将定额磁盘恢复到希望的 MDisk。 要将定额磁盘恢复为正确的 MDisk,请发出相应的 chquorum CLI 命令。
    Note: 如果在系统上启用了 IP 定额,那么在重新生成系统证书时不会自动恢复 IP 定额。 需要手动重新启用 IP 定额,方法是从 GUI 中的设置>系统>IP 定额选项卡下载 Java 应用程序,然后在主机服务器上安装该应用程序。
您可以通过发出以下 CLI 命令,在配置的 /tmp 目录中除去任何不想要的配置备份和恢复文件。
svcconfigclear-all