本ページの製品は2024年4月1日より、エフサステクノロジーズ株式会社に統合となり、順次、切り替えを実施してまいります。一部、富士通表記が混在することがありますので、ご了承ください。

MetroCluster マニュアル ( CA08871-401 )

MetroClusterのデータ保護およびディザスタリカバリーの概要

MetroClusterでデータ保護と障害からの透過的なリカバリーが実装される仕組みを理解することで、スイッチオーバーとスイッチバックの作業を簡単かつ効率的に実施できます。

MetroClusterは、ミラーリングを使用してクラスタ内のデータを保護します。ディザスタリカバリーは1つのMetroClusterコマンドで実装されます。このコマンドは、サバイバーサイトのセカンダリーをアクティブ化して、災害の影響を受けたプライマリーサイトが本来所有していた、ミラーリングされたデータを提供できるようにします。

8ノード / 4ノードMetroCluster構成でのローカルフェイルオーバーとスイッチオーバー

8ノード / 4ノードMetroCluster構成では、ローカルレベルとクラスタレベルの両方でデータが保護されます。MetroCluster構成をセットアップする場合は、MetroCluster構成がどのようにデータを保護するかを理解しておく必要があります。

MetroCluster構成は、物理的に分離され、ミラーされた2つのクラスタを使用することでデータを保護します。各クラスタで、もう一方のクラスタのデータおよびStorage Virtual Machine（SVM）の設定が同期的にミラーされます。一方のサイトで災害が発生すると、管理者は、ミラーされたSVMをアクティブ化し、サバイバーサイトからミラーされたデータの提供を開始することができます。さらに、各クラスタ内のノードはHAペアとして構成されているため、ローカルフェイルオーバーも可能になります。

MetroCluster構成でのローカルのHAデータ保護の仕組み

MetroCluster構成でのHAペアの仕組みを理解する必要があります。

ピアネットワークにある2つのクラスタは、それぞれがもう一方のクラスタのソースクラスタまたはバックアップクラスタになることで、双方向のディザスタリカバリーを実現します。各クラスタは、HAペアとして構成された2つのノードで構成されます。1つのノード構成内で障害が発生した場合やメンテナンスが必要な場合、ストレージフェイルオーバーによって、そのノードの機能をローカルのHAパートナーに転送することができます。

MetroCluster構成でのデータと設定のレプリケーション

MetroCluster構成では、各種のONTAP機能を使用して、2つのMetroClusterサイトの間でデータと設定の同期レプリケーションが行われます。

設定レプリケーションサービスによる設定の保護

ONTAPのConfiguration Replication Service（CRS;設定レプリケーションサービス）は、DRパートナーに情報を自動的にレプリケートしてMetroCluster構成を保護します。

CRSは、ローカルノードの設定をパートナークラスタのDRパートナーに同期的にレプリケートします。このレプリケーションは、クラスタピアリングネットワーク経由で行われます。

レプリケートされる情報には、クラスタの設定とSVMの設定が含まれます。

MetroCluster処理中のSVMのレプリケート

ONTAPのConfiguration Replication Service（CRS;設定レプリケーションサービス）は、冗長なデータサーバー構成とSVMに属するデータボリュームのミラーリングを提供します。スイッチオーバーでは、ソースSVMが停止し、サバイバークラスタ上にあるデスティネーションSVMがアクティブになります。

MetroCluster構成のデスティネーションSVMの名前には、識別しやすいようにサフィックス「-mc」が自動的に付加されます。MetroCluster構成では、デスティネーションSVMの名前にサフィックス「-mc」が付加されます。SVM名にピリオドが含まれている場合は、最初のピリオドの前にサフィックス「-mc」が付加されます。例えば、SVM名がSVM.DNS.NAMEの場合、サフィックス「-mc」を付加したあとの名前はSVM-MC.DNS.NAMEとなります。

次の例は、MetroCluster構成のSVMを示しています。「SVM_cluster_A」はソースサイトのSVM、「SVM_cluster_A-mc」はディザスタリカバリーサイトの同期先のアグリゲートです。

SVM_cluster_AはクラスタAのデータを提供します。

これは同期元のSVMであり、SVMの設定（LIF、プロトコル、サービス）およびSVMに属するボリュームのデータを表します。設定とデータは、クラスタBにある同期先のSVM、SVM_cluster_A-mcにレプリケートされます。
SVM_cluster_BはクラスタBのデータを提供します。

これは同期元のSVMであり、クラスタAにあるSVM_cluster_B-mcに対する設定とデータを表します。
SVM_cluster_B-mcは同期先のSVMであり、MetroCluster構成が通常どおり正常に動作している間は停止しています。

クラスタBからクラスタAへのスイッチオーバーが成功するとSVM_cluster_Bは停止し、SVM_cluster_B-mcがアクティブになって、クラスタAのデータ提供を開始します。
SVM_cluster_A-mcは同期先のSVMであり、MetroCluster構成が通常どおり正常に動作している間は停止しています。

クラスタAからクラスタBへのスイッチオーバーが成功するとSVM_cluster_Aは停止し、SVM_cluster_A-mcがアクティブになって、クラスタBのデータ提供を開始します。

スイッチオーバーが行われると、サバイバークラスタ上のリモートプレックスがオンラインになり、セカンダリーSVMがデータの提供を開始します。

スイッチオーバー後にリモートプレックスを使用できるかは、MetroCluster構成のタイプによって決まります。

MetroCluster IP構成でリモートプレックスを使用できるかは、ONTAPのバージョンによって決まります。
- ONTAPでは、ディザスタサイトのノードがブートしたままの場合、ローカルプレックスとリモートプレックスの両方がオンラインのままになります。

MetroCluster構成でのSyncMirrorを使用したデータ冗長性の実現

SyncMirror機能を使用するミラーされたアグリゲートにはソースとデスティネーションのStorage Virtual Machine（SVM）が所有するボリュームが格納され、データの冗長性が確保されます。データはパートナークラスタのディスクプールにレプリケートされます。ミラーされていないアグリゲートもサポートされます。

次の表に、スイッチオーバー後のミラーされていないアグリゲートの状態（オンラインまたはオフライン）を示します。

スイッチオーバーのタイプ h

MetroCluster IP構成の状態

ネゴシエートスイッチオーバー（NSO）

オフライン（注1）

自動計画外スイッチオーバー（AUSO）

オフライン（注1）

計画外スイッチオーバー（USO）

オフライン（注1）

注1：MetroCluster IP構成では、スイッチオーバーの完了後に、ミラーされていないアグリゲートを手動でオンラインにすることができます。

スイッチオーバー後に、ミラーされていないアグリゲートがDRパートナーノードにある状態でスイッチ間リンク（ISL）に障害が発生すると、そのローカルノードで障害が発生することがあります。

次の図は、ディスクプールがパートナークラスタ間でミラーされる仕組みを示しています。ローカルプレックス（プール0内）のデータは、リモートプレックス（プール1内）にレプリケートされます。

ハイブリッドアグリゲートを使用している場合、ソリッドステートディスク（SSD）レイヤーの空きスペースがなくなったことが原因でSyncMirrorプレックスに障害が発生すると、パフォーマンスが低下する可能性があります。

MetroCluster構成でのNVRAM / NVMEMキャッシュミラーリングと動的ミラーリング

ストレージコントローラーの不揮発性メモリー（プラットフォームモデルに応じてNVRAMまたはNVMEM）は、ローカルHAパートナーにローカルでミラーされ、同時にパートナーサイトのリモートディザスタリカバリー（DR）パートナーにリモートでミラーされます。この構成により、ローカルでフェイルオーバーまたはスイッチオーバーが発生しても、不揮発性キャッシュ内のデータを保護することができます。

MetroCluster構成に含まれていないHAペアでは、各ストレージコントローラーが不揮発性キャッシュパーティションを2つ（当該コントローラーとそのHAパートナー用に1つずつ）使用します。

4ノードMetroCluster構成では、各ストレージコントローラーの不揮発性キャッシュが4つのパーティションに分かれています。2ノードMetroCluster構成では、ストレージコントローラーがHAペアとして構成されないため、HAパートナーパーティションとDR補助パーティションが使用されません。

ストレージコントローラーの不揮発性キャッシュ
MetroCluster構成	MetroClusterに属さないHAペア

ストレージコントローラーの不揮発性キャッシュ

MetroCluster構成

MetroClusterに属さないHAペア

mcc nvram quartering

mcc nvram split in non mcc ha pair

不揮発性キャッシュには次のデータが格納されます。

ローカルパーティションは、ストレージコントローラーからディスクに書き込まれる前のデータを格納します。
HAパートナーパーティションは、HAパートナーのローカルキャッシュのコピーを格納します。

2ノードMetroCluster構成では、ストレージコントローラーがHAペアとして構成されないため、HAパートナーパーティションは存在しません。
DRパートナーパーティションは、DRパートナーのローカルキャッシュのコピーを格納します。

DRパートナーは、ローカルノードと対の関係にあるパートナークラスタ内のノードです。
DR HA パートナーパーティションは、DR HA パートナーのローカルキャッシュのコピーを格納します。

DR HA パートナーは、ローカルノードのDRパートナーのHAパートナーです。このキャッシュは、HAテイクオーバーが実行された場合（構成の通常動作中またはMetroClusterスイッチオーバー後）に必要です。

2ノードMetroCluster構成では、ストレージコントローラーがHAペアとして構成されないため、DR HA パートナーパーティションは存在しません。

例えば、ノード（node_A_1）のローカルキャッシュは、MetroClusterサイトでローカルおよびリモートの両方でミラーされます。次の図では、node_A_1のローカルキャッシュが、HAパートナー（node_A_2）とDRパートナー（node_B_1）にミラーされています。

ローカルのHAテイクオーバー時の動的なミラーリング

4ノードMetroCluster構成でローカルのHAテイクオーバーが行われると、テイクオーバーされたノードはDRパートナーのミラーとして機能しなくなります。DRミラーリングを続行するために、ミラーリング先が自動的にDR HA パートナーへと切り替わります。ギブバックが正常に終了すると、ミラーリング先は自動的にDRパートナーに戻ります。

例えば、node_B_1で障害が発生し、node_B_2によってテイクオーバーされたとします。この場合、node_A_1のローカルキャッシュをnode_B_1にミラーできなくなり、ミラーリング先がDR HA パートナーnode_B_2に切り替わります。

mcc nvram mirroring example dynamic dr aux

災害の種類とリカバリー方法

MetroCluster構成を使用して適切に対応できるように、各種の障害や災害について熟知しておく必要があります。

単一ノード障害

ローカルHAペアの1つのコンポーネントで発生する障害です。

4ノードのMetroCluster構成の場合、障害が発生したコンポーネントによっては、障害ノードの自動テイクオーバーまたはネゴシエートテイクオーバーが行われる可能性があります。データリカバリーについては、ハイアベイラビリティペアの管理で説明します。

2ノードMetroCluster構成の場合は、自動計画外スイッチオーバー（AUSO）が行われます。
サイト全体のコントローラー障害

電力供給の停止、機器の交換、または災害が原因で、サイトにあるすべてのコントローラーモジュールで障害が発生します。通常、MetroCluster構成では障害と災害を区別できません。しかし、MetroCluster Tiebreakerソフトウェアなどの監視ソフトウェアはこれらを区別できます。スイッチ間リンク（ISL）およびスイッチが稼働しており、ストレージにアクセスできる場合は、サイト全体のコントローラー障害によって自動スイッチオーバーが実行される可能性があります。

ハイアベイラビリティペアの管理には、サイト全体のコントローラー障害、および1台以上のコントローラーを含む障害からのリカバリー方法が詳しく記載されています。
ISL障害

サイト間のリンクで発生する障害です。MetroCluster構成による対応はありません。各ノードは通常どおりデータを提供しますが、対応するディザスタリカバリーサイトにアクセスできないため、ミラーデータの書き込みは行われません。
複数の連続的な障害

複数のコンポーネントで連続して発生する障害です。例えば、コントローラーモジュール、スイッチファブリック、およびシェルフで連続して障害が発生した結果、ダウンタイムやデータ損失から保護するために、ストレージのフェイルオーバー、ファブリックの冗長処理、およびSyncMirrorが順次行われる場合です。

次の表に、障害の種類、および対応するディザスタリカバリー（DR）メカニズムとリカバリー方法を示します。

MetroCluster IP構成では、自動計画外スイッチオーバー（AUSO）はサポートされません。

障害タイプ	DRメカニズム	リカバリー方法の概要
4ノード構成	2ノード構成	4ノード構成	2ノード構成
単一ノード障害	ローカルHAフェイルオーバー	AUSO	自動フェイルオーバーとギブバックが有効になっている場合は必要なし。	ノードがリストアされたら、`metrocluster switchback`コマンドを使用して手動による修復とスイッチバックを行う必要があります。
サイト障害	MetroClusterスイッチオーバー	ノードがリストアされたら、`metrocluster healing`コマンドと`metrocluster switchback`コマンドを使用して手動による修復とスイッチバックを行う必要があります。
サイト全体のコントローラー障害	AUSO。ディザスタサイトのストレージにアクセスできる場合のみ。	AUSO（単一ノード障害と同じ）
複数の連続的な障害	ローカルHAフェイルオーバーのあとに、`metrocluster switchover -forced-on-disaster`コマンドを使用してMetroCluster強制スイッチオーバーを実行。 NOTE: 障害が発生したコンポーネントによっては、強制スイッチオーバーは不要。	`metrocluster switchover -forced-on-disaster`コマンドを使用したMetroClusterの強制スイッチオーバー。
ISL障害	MetroClusterのスイッチオーバーなし。2つのクラスタがそれぞれのデータを独立して提供。	必要なし。接続が回復すると、ストレージは自動的に再同期されます。

障害タイプ

DRメカニズム

リカバリー方法の概要

4ノード構成

2ノード構成

4ノード構成

2ノード構成

単一ノード障害

ローカルHAフェイルオーバー

AUSO

自動フェイルオーバーとギブバックが有効になっている場合は必要なし。

ノードがリストアされたら、metrocluster switchbackコマンドを使用して手動による修復とスイッチバックを行う必要があります。

サイト障害

MetroClusterスイッチオーバー

ノードがリストアされたら、metrocluster healingコマンドとmetrocluster switchbackコマンドを使用して手動による修復とスイッチバックを行う必要があります。

サイト全体のコントローラー障害

AUSO。ディザスタサイトのストレージにアクセスできる場合のみ。

AUSO（単一ノード障害と同じ）

複数の連続的な障害

ローカルHAフェイルオーバーのあとに、metrocluster switchover -forced-on-disasterコマンドを使用してMetroCluster強制スイッチオーバーを実行。

NOTE: 障害が発生したコンポーネントによっては、強制スイッチオーバーは不要。

metrocluster switchover -forced-on-disasterコマンドを使用したMetroClusterの強制スイッチオーバー。

ISL障害

MetroClusterのスイッチオーバーなし。2つのクラスタがそれぞれのデータを独立して提供。

必要なし。接続が回復すると、ストレージは自動的に再同期されます。

8ノード / 4ノードMetroCluster構成でのノンストップオペレーションの実現

8ノード / 4ノードのMetroCluster構成は各サイトに1つ以上のHAペアで構成されるため、それぞれのサイトでのローカルな障害には、パートナーサイトにスイッチオーバーしなくても対応でき、サービスが中断することはありません。HAペアの動作は、非MetroCluster構成のHAペアと同じです。

4ノードと8ノードのMetroCluster構成では、パニックまたは停電によるノード障害が発生すると、自動スイッチオーバーが動作することがあります。

ハイアベイラビリティペアの管理

ローカルフェイルオーバー後に2回目の障害が発生した場合、MetroClusterのスイッチオーバーイベントによって、中断のないノンストップオペレーションが実現します。同様に、スイッチオーバー処理後にサバイバーノードの1つで次の障害が発生すると、ローカルのフェイルオーバーイベントによってノンストップオペレーションが継続されます。この場合、正常に稼働している1つのノードが、DRグループ内の他の3ノードにデータを提供します。

2ノードMetroCluster構成でのノンストップオペレーションの実現

2つのサイトのどちらかでパニックによる問題が発生した場合は、MetroClusterスイッチオーバーによってノンストップオペレーションが継続されます。停電によってノードとストレージの両方が影響を受けた場合は、スイッチオーバーが自動的に行われず、metrocluster switchoverコマンドを実行するまでシステムが停止します。

すべてのストレージはミラーリングされるため、ノード障害でのHAペアのストレージフェイルオーバーの場合と同じように、サイト障害が発生した場合は、スイッチオーバー操作を使用して無停止の耐障害性を実現できます。

2ノード構成では、HAペアで自動ストレージフェイルオーバーをトリガーするイベントと同じイベントによって、自動計画外スイッチオーバー（AUSO）がトリガーされます。つまり、2ノードMetroCluster構成ではHAペアと同じ保護レベルが確保されます。

スイッチオーバープロセスの概要

MetroClusterのスイッチオーバー処理では、ストレージとクライアントのアクセスをソースクラスタからリモートサイトに移動することで、災害発生後にサービスを即座に再開できます。スイッチオーバーが発生した場合に予想される変更や、実行する必要があるアクションを把握しておく必要があります。

スイッチオーバー処理中に、システムは次の処理を実行します。

ディザスタサイトに属するディスクの所有権がディザスタリカバリー（DR）パートナーに変更されます。

これは、停止中のパートナーに属するディスクの所有権が正常な状態のパートナーに変更されるハイアベイラビリティ（HA）ペアでのローカルフェイルオーバーと似ています。
サバイバーサイトにあるサバイバープレックスがディザスタクラスタ内のノードに属する場合、そのサバイバープレックスは、サバイバーサイトのクラスタでオンラインになります。
ディザスタサイトに属する同期元のStorage Virtual Machine（SVM）が、ネゴシエート　スイッチオーバーの実行中のみ停止されます。

この処理は、ネゴシエートスイッチオーバーにのみ該当します。
ディザスタサイトに属する同期先のSVMが起動されます。

スイッチオーバー中は、DRパートナーのルートアグリゲートはオンラインになりません。

metrocluster switchoverコマンドは、MetroCluster構成にあるすべてのDRグループのノードを切り替えます。例えば、8ノードMetroCluster構成では、両方のDRグループのノードをスイッチオーバーします。

サービスのみをリモートサイトにスイッチオーバーする場合は、サイトをフェンシングせずにネゴシエートスイッチオーバーを実行します。ストレージまたは機器を信頼できない場合は、ディザスタサイトをフェンシングしてから、計画外スイッチオーバーを実行する必要があります。フェンシングにより、ディスクに電源が順次投入されたときのRAIDの再構築が回避されます。

この手順は、もう一方のサイトが安定しておりオフラインにすることがない場合にのみ使用してください。

スイッチオーバー中に使用できるコマンド

次の表は、スイッチオーバー中に実行できるコマンドの一覧です。

コマンド	利用可否に関する補足
`storage aggregate create`	次のアグリゲートを作成できます。サバイバークラスタに属するノードが所有しているアグリゲート次のアグリゲートは作成できません。ディザスタサイトのノードのアグリゲートサバイバークラスタに属するノードのアグリゲート
`storage aggregate delete`	データアグリゲートを削除できます。
`storage aggregate mirror`	ミラーされていないアグリゲートのプレックスを作成できます。
`storage aggregate plex delete`	ミラーされたアグリゲートのプレックスを削除できます。
`vserver create`	次のSVMを作成できます。ルートボリュームがサバイバークラスタの所有するデータアグリゲートにあるSVM 次のSVMは作成できません。ルートボリュームがディザスタクラスタの所有するデータアグリゲートにあるSVM
`vserver delete`	同期元と同期先の両方のSVMを削除できます。
`network interface create -lif`	同期元と同期先の両方のSVMのデータSVM LIFを作成できます。
`network interface delete -lif`	同期元と同期先の両方のSVMのデータSVM LIFを削除できます。
`volume create`	同期元と同期先の両方のSVMのボリュームを作成できます。同期元のSVMの場合、ボリュームはサバイバークラスタが所有するデータアグリゲートにある必要があります。同期先のSVMの場合、ボリュームはディザスタクラスタが所有するデータアグリゲートにある必要があります。
`volume delete`	同期元と同期先の両方のSVMのボリュームを削除できます。
`volume move`	同期元と同期先の両方のSVMのボリュームを移動できます。同期元のSVMの場合、サバイバークラスタがデスティネーションアグリゲートを所有している必要があります。同期先のSVMの場合、ディザスタクラスタがデスティネーションアグリゲートを所有している必要があります。
`snapmirror break`	データ保護ミラーのソースとデスティネーションのエンドポイント間のSnapMirror関係を解除できます。

コマンド

利用可否に関する補足

storage aggregate create

次のアグリゲートを作成できます。

サバイバークラスタに属するノードが所有しているアグリゲート

次のアグリゲートは作成できません。

ディザスタサイトのノードのアグリゲート
サバイバークラスタに属するノードのアグリゲート

storage aggregate delete

データアグリゲートを削除できます。

storage aggregate mirror

ミラーされていないアグリゲートのプレックスを作成できます。

storage aggregate plex delete

ミラーされたアグリゲートのプレックスを削除できます。

vserver create

次のSVMを作成できます。

ルートボリュームがサバイバークラスタの所有するデータアグリゲートにあるSVM

次のSVMは作成できません。

ルートボリュームがディザスタクラスタの所有するデータアグリゲートにあるSVM

vserver delete

同期元と同期先の両方のSVMを削除できます。

network interface create -lif

同期元と同期先の両方のSVMのデータSVM LIFを作成できます。

network interface delete -lif

同期元と同期先の両方のSVMのデータSVM LIFを削除できます。

volume create

同期元と同期先の両方のSVMのボリュームを作成できます。

同期元のSVMの場合、ボリュームはサバイバークラスタが所有するデータアグリゲートにある必要があります。
同期先のSVMの場合、ボリュームはディザスタクラスタが所有するデータアグリゲートにある必要があります。

volume delete

同期元と同期先の両方のSVMのボリュームを削除できます。

volume move

同期元と同期先の両方のSVMのボリュームを移動できます。

同期元のSVMの場合、サバイバークラスタがデスティネーションアグリゲートを所有している必要があります。
同期先のSVMの場合、ディザスタクラスタがデスティネーションアグリゲートを所有している必要があります。

snapmirror break

データ保護ミラーのソースとデスティネーションのエンドポイント間のSnapMirror関係を解除できます。

4ノードMetroCluster構成でのHAテイクオーバー中およびMetroClusterスイッチオーバー中のディスク所有権の変更

ハイアベイラビリティ処理およびMetroCluster処理中、ディスク所有権が一時的に変更されます。どのノードがどのディスクを所有するかをシステムが追跡する仕組みを把握しておくと役に立ちます。

ONTAPは、コントローラーモジュールの固有なシステムID（ノードのNVRAMカードまたはNVMEMボードから取得）を使用して、どのノードがどの特定のディスクを所有するかを識別します。システムのHAまたはDRの状態によっては、ディスク所有権が一時的に変わる場合があります。HAテイクオーバーまたはDRスイッチオーバーによって所有権が変わった場合、HAギブバックまたはDRスイッチバックの終了後に所有権を元に戻すことができるよう、どのノードがディスクの元々の（「ホーム」）所有者であるかが記録されます。ディスク所有権の追跡には次のフィールドが使用されます。

所有者
ホーム所有者
DRホーム所有者

MetroCluster構成でスイッチオーバーが実行された場合、ノードは、パートナークラスタのノードが元々所有していたアグリゲートの所有権を取得できます。このようなアグリゲートは「クラスタ外アグリゲート」と呼ばれます。クラスタ外アグリゲートはその時点でクラスタに認識されていないアグリゲートで、したがって、DRホーム所有者フィールドにはパートナークラスタのノードが所有者として表示されます。HAペア内の従来の外部アグリゲートは所有者とホーム所有者の値が異なりますが、クラスタ外アグリゲートは所有者とホーム所有者の値が同じであるため、DRホーム所有者の値で識別できます。

システムの状態が変化するにしたがい、これらのフィールドの値も次の表に示すように変わります。

フィールド	状況別の値
通常動作	ローカルのHAテイクオーバー	MetroClusterスイッチオーバー	スイッチオーバー中のテイクオーバー
所有者	ディスクにアクセスできるノードのID	一時的にディスクにアクセスできるHAパートナーのID	一時的にディスクにアクセスできるDRパートナーのID	一時的にディスクにアクセスできるDR HA パートナーのID
ホーム所有者	HAペア内の元のディスク所有者のID	HAペア内の元のディスク所有者のID	スイッチオーバー中にHAペアのホーム所有者となるDRパートナーのID	スイッチオーバー中にHAペアのホーム所有者となるDRパートナーのID
DRホーム所有者	空き	空き	MetroCluster構成内の元のディスク所有者のID	MetroCluster構成内の元のディスク所有者のID

フィールド

状況別の値

通常動作

ローカルのHAテイクオーバー

MetroClusterスイッチオーバー

スイッチオーバー中のテイクオーバー

所有者

ディスクにアクセスできるノードのID

一時的にディスクにアクセスできるHAパートナーのID

一時的にディスクにアクセスできるDRパートナーのID

一時的にディスクにアクセスできるDR HA パートナーのID

ホーム所有者

HAペア内の元のディスク所有者のID

スイッチオーバー中にHAペアのホーム所有者となるDRパートナーのID

DRホーム所有者

空き

MetroCluster構成内の元のディスク所有者のID

次の図と表は、物理的にはcluster_Bに配置されているnode_A_1のディスクプール1のディスクについて、所有権が変化する例を示しています。

MetroClusterの状態	所有者	ホーム所有者	DRホーム所有者	注
通常の状態：すべてのノードが完全に動作	node_A_1	node_A_1	該当なし
ローカルのHAテイクオーバー：node_A_2がHAパートナーnode_A_1に属するディスクをテイクオーバー	node_A_2	node_A_1	該当なし
DRスイッチオーバー：node_B_1がDRパートナーnode_A_1に属するディスクをテイクオーバー	node_B_1	node_B_1	node_A_1	元のホームノードIDはDRホーム所有者フィールドに移動します。アグリゲートのスイッチバックまたは修復後、所有権はnode_A_1に戻ります。
DRのスイッチオーバーとローカルのHAテイクオーバー（二重障害）：node_B_2がHA node_B_1に属するディスクをテイクオーバー	node_B_2	node_B_1	node_A_1	ギブバック後、所有権はnode_B_1に戻ります。スイッチバックまたは修復後、所有権はnode_A_1に戻ります。
HAギブバックおよびDRスイッチバック後：すべてのノードが完全に動作	node_A_1	node_A_1	該当なし

MetroClusterの状態

所有者

ホーム所有者

DRホーム所有者

注

通常の状態：すべてのノードが完全に動作

node_A_1

該当なし

ローカルのHAテイクオーバー：node_A_2がHAパートナーnode_A_1に属するディスクをテイクオーバー

node_A_2

node_A_1

該当なし

DRスイッチオーバー：node_B_1がDRパートナーnode_A_1に属するディスクをテイクオーバー

node_B_1

node_A_1

元のホームノードIDはDRホーム所有者フィールドに移動します。アグリゲートのスイッチバックまたは修復後、所有権はnode_A_1に戻ります。

DRのスイッチオーバーとローカルのHAテイクオーバー（二重障害）：node_B_2がHA node_B_1に属するディスクをテイクオーバー

node_B_2

node_B_1

node_A_1

ギブバック後、所有権はnode_B_1に戻ります。スイッチバックまたは修復後、所有権はnode_A_1に戻ります。

HAギブバックおよびDRスイッチバック後：すべてのノードが完全に動作

node_A_1

該当なし

ミラーされていないアグリゲートを使用する場合の考慮事項

ミラーされていないアグリゲートが構成に含まれている場合、スイッチオーバー処理後にアクセスに関する問題が発生する可能性があります。

電源の切断が必要なメンテナンス実施時のミラーされていないアグリゲートに関する考慮事項

サイト全体の電源の切断が必要なメンテナンスのためにネゴシエートスイッチオーバーを実行する場合は、最初にディザスタサイトが所有するミラーされていないアグリゲートを手動でオフラインにする必要があります。

オフラインにしない場合は、複数のディスクがパニック状態になって、サバイバーサイトのノードが停止する可能性があります。この問題が発生するのは、電源の切断またはISLの喪失によってディザスタサイトのストレージへの接続が失われたために、スイッチオーバーされたミラーされていないアグリゲートがオフラインになるか、または見つからない場合です。

ミラーされていないアグリゲートと階層状のネームスペースに関する考慮事項

階層状のネームスペースを使用している場合は、パス内のすべてのボリュームがミラーされたアグリゲートのみ、またはミラーされていないアグリゲートのみに配置されるようにジャンクションパスを設定する必要があります。ジャンクションパスにミラーされていないアグリゲートとミラーされたアグリゲートが混在していると、スイッチオーバー処理後にミラーされていないアグリゲートにアクセスできなくなる可能性があります。

ミラーされていないアグリゲート、CRSメタデータボリューム、およびデータSVMのルートボリュームに関する考慮事項

設定レプリケーションサービス（CRS）メタデータボリュームとデータSVMのルートボリュームは、ミラーされたアグリゲートに配置する必要があります。これらのボリュームをミラーされていないアグリゲートに移動することはできません。ミラーされていないアグリゲートに配置されている場合、ネゴシエートスイッチオーバー処理とスイッチバック処理が拒否されます。その場合、metrocluster checkコマンドによって警告が表示されます。

ミラーされていないアグリゲートとSVMに関する考慮事項

SVMは、ミラーされたアグリゲートでのみ、またはミラーされていないアグリゲートでのみ設定する必要があります。ミラーされていないアグリゲートとミラーされたアグリゲートが混在しているとスイッチオーバー処理に2分以上かかり、ミラーされていないアグリゲートがオンラインにならない場合にデータを利用できなくなることがあります。

ミラーされていないアグリゲートとSANに関する考慮事項

ミラーされていないアグリゲートにはLUNを配置しないでください。ミラーされていないアグリゲートにLUNを設定すると、スイッチオーバー処理に2分以上かかってデータを利用できなくなることがあります。

MetroCluster IP構成でのMediator アシスト自動計画外スイッチオーバー

MetroCluster IP構成でONTAP Mediatorが自動計画外スイッチオーバーをサポートする方法は、こちらを参照してください。

修復時の動作（MetroCluster IP構成）

MetroCluster IP構成での修復では、ミラーされたアグリゲートの再同期が実施され、修復されたディザスタサイトのノードがスイッチバックに向けて準備されます。これは計画的なイベントです。したがって、各手順を細かく制御してダウンタイムを最小限にすることができます。修復は、ストレージとコントローラーのコンポーネントで発生する、2段階のプロセスです。

データアグリゲートの修復

ディザスタサイトでの問題が解決したら、ストレージ修復フェーズを開始します。

サバイバーサイトで、すべてのノードが稼働中であることを確認します。
ルートアグリゲートを含め、ディザスタサイトのプール0のすべてのディスクの所有権を変更します。

このフェーズでは、RAIDサブシステムがミラーされたアグリゲートを再同期し、WAFLサブシステムが、スイッチオーバー時にプール1プレックスで障害が発生したミラーされたアグリゲートのnvsaveファイルを再実行します。

ソースのストレージコンポーネントの一部で障害が発生した場合は、該当するレベル（Storage、Sanown、またはRAID）でエラーが報告されます。

エラーが何も報告されなければ、アグリゲートの再同期は成功です。このプロセスは、完了までに数時間かかることがあります。

構成の修復

ルートアグリゲートの修復

アグリゲートの同期が完了したら、ルートアグリゲートの修復フェーズを実行します。MetroCluster IP構成では、アグリゲートが修復されたことをこのフェーズで確認します。

構成の修復

スイッチオーバー後のMetroCluster IP構成でのアグリゲートの自動修復

MetroCluster IP構成では、ネゴシエートスイッチオーバー処理の実行中に自動的に修復が実行されます。計画外スイッチオーバー後の自動修復がサポートされます。これにより、metrocluster healコマンドを実行する必要がなくなります。

ネゴシエートスイッチオーバー後の自動修復（ONTAP 9.5以降）

ネゴシエートスイッチオーバー（-forced-on-disaster trueオプションを指定せずにスイッチオーバーコマンドを実行）の実施後、システムを通常動作に戻すために必要な手順が自動修復機能によって実行されます。自動修復に対応したシステムでは、スイッチオーバー後に次の状況が発生します。

ディザスタサイトのノードは稼働したままです。

これらのノードはスイッチオーバーされているため、ローカルのミラーされたプレックスからはデータを提供していません。
ディザスタサイトのノードが「Waiting for switchback」状態に移行します。

ディザスタサイトのノードのステータスは、metrocluster operation showコマンドで確認できます。
修復コマンドを実行せずにスイッチバック処理を実行できます。

この機能は、ONTAP 9.5以降を実行するMetroCluster IP構成に該当します。MetroCluster FC構成には適用されません。

計画外スイッチオーバー後の自動修復

MetroCluster IP構成では、計画外スイッチオーバー後の自動修復がサポートされます。計画外スイッチオーバーでは、-forced-on-disaster trueオプションを指定してswitchoverコマンドを実行します。

ONTAP 9.7以降を実行するシステムでは、計画外スイッチオーバー後に次の状況が発生します。

災害の規模によっては、ディザスタサイトのノードが停止します。

これらのノードはスイッチオーバーされているため、電源が入っていてもローカルのミラーされたプレックスからはデータを提供していません。
ディザスタサイトが停止していた場合は、ブート時にディザスタサイトのノードが「Waiting for switchback」状態に移行します。

ディザスタサイトが稼働していた場合は、ただちに「Waiting for switchback」状態に移行します。
修復処理が自動的に実行されます。

ディザスタサイトのノードのステータスおよび修復処理が成功したかは、metrocluster operation showコマンドで確認できます。

自動修復が失敗した場合

何らかの理由で自動修復処理が失敗した場合は、ONTAP 9.6より前のバージョンのONTAPと同様に、metrocluster healコマンドを手動で実行する必要があります。metrocluster operation showコマンドとmetrocluster operation history show -instanceコマンドを使用して、修復のステータスを監視し、障害の原因を特定できます。

MetroCluster構成用SVMの作成

MetroCluster構成用のSVMを作成して、MetroCluster構成用に設定されたクラスタのデータに対して同期ディザスタリカバリーおよび高可用性を提供できます。

2つのクラスタがMetroCluster構成になっている必要があります。
両方のクラスタ内でアグリゲートが利用可能でオンラインになっている必要があります。
必要に応じて、両方のクラスタに同じ名前のIPspaceを作成しておく必要があります。
MetroCluster構成を形成する一方のクラスタをスイッチオーバーを使用せずにリブートすると、同期元SVMが「started」ではなく「stopped」の状態でオンラインになることがあります。

MetroCluster構成のどちらかのクラスタにSVMを作成する場合、そのSVMはソースSVMとして作成されます。パートナーSVMは同じ名前で自動的に作成されますが、パートナークラスタには「-mc」というサフィックスが付加されます。SVM名にピリオドが含まれている場合は、最初のピリオドの前にサフィックス「-mc」が付加されます（例：SVM-MC.DNS.NAME）。

MetroCluster構成では、1つのクラスタに64個のSVMを作成できます。したがって、MetroCluster構成は最大128個のSVMをサポートします。

vserver createコマンドを使用します。

次の例は、ローカルサイトのSVM（サブタイプが「sync-source」）とパートナーサイトのSVM（サブタイプが「sync-destination」）を示しています。
```
cluster_A::>vserver create -vserver vs4 -rootvolume vs4_root -aggregate aggr1
-rootvolume-security-style mixed
[Job 196] Job succeeded:
Vserver creation completed
```
ローカルサイトにSVM 「vs4」が作成され、パートナーサイトにSVM 「vs4-mc」が作成されます。

新しく作成されたSVMを表示します。

ローカルクラスタで、SVMの設定状態を確認します。

metrocluster vserver show

次の例は、パートナーSVMとその設定状態を示しています。

cluster_A::> metrocluster vserver show

                      Partner    Configuration
Cluster     Vserver   Vserver    State
---------  --------  --------- -----------------
cluster_A   vs4       vs4-mc     healthy
cluster_B   vs1       vs1-mc     healthy

ローカルクラスタとパートナークラスタから、新しく設定したSVMの状態を確認します。

vserver show command

次の例は、SVMの管理状態と運用状態を表示します。

cluster_A::> vserver show

                             Admin   Operational Root
Vserver Type  Subtype        State   State       Volume     Aggregate
------- ----- -------       ------- --------    ----------- ----------
vs4     data  sync-source   running   running    vs4_root   aggr1

cluster_B::> vserver show

                               Admin   Operational  Root
Vserver Type  Subtype          State   State        Volume      Aggregate
------- ----- -------          ------  ---------    ----------- ----------
vs4-mc  data  sync-destination running stopped      vs4_root    aggr1

ルートボリュームの作成などの中間処理が失敗し、SVMの状態が「initializing」になっている場合は、SVMの作成が失敗することがあります。その場合、SVMを削除して再度作成する必要があります。

MetroCluster構成用のSVMが、1GBのルートボリュームで作成されます。同期元SVMの状態は「running」、同期先SVMの状態は「stopped」になります。

スイッチバック時の動作

ディザスタサイトがリカバリーし、アグリゲートが修復されると、MetroClusterのスイッチバック処理によって、ストレージアクセスとクライアントアクセスがディザスタリカバリーサイトからホームクラスタに戻ります。

metrocluster switchbackコマンドは、プライマリーサイトを通常の完全なMetroCluster状態に戻します。設定に対する変更があった場合、元のSVMに反映されます。次に、データサーバー処理がディザスタサイトの同期元SVMに返され、サバイバーサイトで動作していた同期先SVMは非アクティブになります。

MetroCluster構成がスイッチオーバー状態のときにサバイバーサイトでSVMが削除された場合、スイッチバックプロセスで次の処理が実行されます。

パートナーサイト（元のディザスタサイト）の対応するSVMを削除する
削除されたSVMにピアリング関係がある場合は削除する

MetroCluster マニュアル ( CA08871-401 )

MetroClusterのデータ保護およびディザスタ リカバリーの概要

8ノード / 4ノードMetroCluster構成でのローカル フェイルオーバーとスイッチオーバー

MetroCluster構成でのローカルのHAデータ保護の仕組み

MetroCluster構成でのデータと設定のレプリケーション

設定レプリケーション サービスによる設定の保護

MetroCluster処理中のSVMのレプリケート

MetroCluster構成でのSyncMirrorを使用したデータ冗長性の実現

MetroCluster構成でのNVRAM / NVMEMキャッシュ ミラーリングと動的ミラーリング

ローカルのHAテイクオーバー時の動的なミラーリング

災害の種類とリカバリー方法

8ノード / 4ノードMetroCluster構成でのノンストップ オペレーションの実現

2ノードMetroCluster構成でのノンストップ オペレーションの実現

スイッチオーバー プロセスの概要

スイッチオーバー中に使用できるコマンド

4ノードMetroCluster構成でのHAテイクオーバー中およびMetroClusterスイッチオーバー中のディスク所有権の変更

ミラーされていないアグリゲートを使用する場合の考慮事項

電源の切断が必要なメンテナンス実施時のミラーされていないアグリゲートに関する考慮事項

ミラーされていないアグリゲートと階層状のネームスペースに関する考慮事項

ミラーされていないアグリゲート、CRSメタデータ ボリューム、およびデータSVMのルート ボリュームに関する考慮事項

ミラーされていないアグリゲートとSVMに関する考慮事項

ミラーされていないアグリゲートとSANに関する考慮事項

MetroCluster IP構成でのMediator アシスト自動計画外スイッチオーバー

修復時の動作（MetroCluster IP構成）

データ アグリゲートの修復

ルート アグリゲートの修復

スイッチオーバー後のMetroCluster IP構成でのアグリゲートの自動修復

ネゴシエート スイッチオーバー後の自動修復（ONTAP 9.5以降）

計画外スイッチオーバー後の自動修復

自動修復が失敗した場合

MetroCluster構成用SVMの作成

スイッチバック時の動作

MetroClusterのデータ保護およびディザスタリカバリーの概要

8ノード / 4ノードMetroCluster構成でのローカルフェイルオーバーとスイッチオーバー

設定レプリケーションサービスによる設定の保護

MetroCluster構成でのNVRAM / NVMEMキャッシュミラーリングと動的ミラーリング

8ノード / 4ノードMetroCluster構成でのノンストップオペレーションの実現

2ノードMetroCluster構成でのノンストップオペレーションの実現

スイッチオーバープロセスの概要

ミラーされていないアグリゲート、CRSメタデータボリューム、およびデータSVMのルートボリュームに関する考慮事項

データアグリゲートの修復

ルートアグリゲートの修復

ネゴシエートスイッチオーバー後の自動修復（ONTAP 9.5以降）