MetroCluster マニュアル ( CA08871-401 )
NVFAILを使用したファイルシステム整合性の監視および保護
ONTAPでは、volume modify
コマンドの-nvfail
パラメーターによって、システム起動時またはスイッチオーバー処理後のNVRAM(不揮発性RAM)の不整合を検出できます。また、警告を表示して、ボリュームが手動でリカバリーできるようになるまでデータのアクセスと変更ができないようにシステムを保護します。
ONTAPが何らかの問題を検出すると、データベース インスタンスまたはファイルシステム インスタンスは応答を停止するか、シャットダウンされます。ONTAPはコンソールにエラー メッセージを送信して、データベースまたはファイルシステムの状態をチェックするようユーザーに警告します。NVFAILを有効にすると、データベースの有効性を侵害する可能性のある、クラスタ化されたノード間でのNVRAMの不整合をデータベース管理者に警告できます。
フェイルオーバーまたはブート リカバリーのあとは、NVFAIL状態が解消されるまでNFSクライアントはどのノードからもデータにアクセスできません。CIFSクライアントには影響はありません。
NFSボリュームまたはLUNへのアクセスに対するNVFAILの影響
NVFAIL状態は、起動時にONTAPがNVRAMエラーを検出した場合、MetroClusterスイッチオーバー処理が実行された場合、またはNVFAILオプションが設定されたボリュームのHAテイクオーバー処理中に発生します。起動時にエラーが検出されなければ、ファイル サービスは正常に開始されます。しかし、NVRAMエラーが検出された場合、またはディザスタ スイッチオーバーでNVFAILの処理が実行された場合、ONTAPはデータベース インスタンスの応答を停止します。
NVFAILオプションを有効にすると、起動時に次の表のいずれかのプロセスが開始されます。
状況 |
操作 |
||
---|---|---|---|
ONTAPがNVRAMエラーを検出しなかった場合 |
ファイル サービスが通常どおり開始されます。 |
||
ONTAPがNVRAMエラーを検出した場合 |
|
||
次のいずれかのパラメーターが使用されている場合
|
将来のディザスタ スイッチオーバーでNVFAIL処理を実行する予定がない場合は、スイッチオーバー後に
|
||
ONTAPがLUNを含むボリューム上でNVRAMエラーを検出した場合 |
そのボリュームのLUNがオフラインになります。ボリュームの |
データ損失イベントの監視用コマンド
NVFAILオプションを有効にすると、NVRAMの不整合が原因でシステム クラッシュが発生した場合、またはMetroClusterスイッチオーバーが発生した場合に、通知を受け取ることができます。
デフォルトでは、NVFAILパラメーターは無効になっています。
実行する処理 |
使用するコマンド |
---|---|
NVFAILを有効にして新しいボリュームを作成する |
|
既存のボリュームでNVFAILを有効にする |
注: 作成されたボリュームでNVFAILを有効にするには、 |
指定したボリュームでNVFAILが有効になっているかを表示する |
注: 指定したボリュームのNVFAIL属性を表示するには、 |
詳細については、各コマンドのマニュアル ページを参照してください。
スイッチオーバー後のNVFAIL状態のボリュームへのアクセス
スイッチオーバー後、volume modify
コマンドの-in-nvfailed-state
パラメーターをリセットしてクライアントのデータ アクセス制限を解除し、NVFAIL状態をクリアする必要があります。
データベースまたはファイルシステムが実行されていないこと、または影響を受けるボリュームにアクセスしようとしていないことを確認します。
-in-nvfailed-state
パラメーターを設定するには、advanced権限レベルが必要です。
-
-in-nvfailed-state
パラメーターをfalseに設定してvolume modify
コマンドを使用し、ボリュームをリカバリーします。
データベース ファイルの有効性を調べる手順については、使用しているデータベース ソフトウェアのマニュアルを参照してください。
データベースでLUNを使用している場合は、NVRAMの障害発生後にホストからLUNにアクセスできるようにする手順を確認してください。
スイッチオーバー後のNVFAIL状態にあるLUNのリカバリー
スイッチオーバーが発生すると、NVFAIL状態にあるLUN上のデータにホストがアクセスできなくなります。データベースがLUNにアクセスできるようにするには、いくつかの作業が必要です。
データベースが実行されていないことが必要です。
-
volume modify
コマンドの-in-nvfailed-state
パラメーターをリセットし、影響を受けた、LUNをホストするボリュームのNVFAIL状態をクリアします。 -
影響を受けたLUNをオンラインにします。
-
LUNでデータの不整合の有無を確認し、これを解決します。
これには、ホスト ベースのリカバリーを実行するか、SnapRestoreを使用してストレージ コントローラー上でリカバリーを実行します。
-
LUNをリカバリーしたあと、データベース アプリケーションをオンラインにします。