エフサステクノロジーズ株式会社

本ページの製品は2024年4月1日より、エフサステクノロジーズ株式会社に統合となり、順次、切り替えを実施してまいります。一部、富士通表記が混在することがありますので、ご了承ください。

MetroCluster マニュアル

to English version

NVFAILを使用したファイルシステム整合性の監視および保護

ONTAPでは、volume modifyコマンドの-nvfailパラメーターによって、システム起動時またはスイッチオーバー処理後のNVRAM(不揮発性RAM)の不整合を検出できます。また、警告を表示して、ボリュームが手動でリカバリーできるようになるまでデータのアクセスと変更ができないようにシステムを保護します。

ONTAPが何らかの問題を検出すると、データベース インスタンスまたはファイルシステム インスタンスは応答を停止するか、シャットダウンされます。ONTAPはコンソールにエラー メッセージを送信して、データベースまたはファイルシステムの状態をチェックするようユーザーに警告します。NVFAILを有効にすると、データベースの有効性を侵害する可能性のある、クラスタ化されたノード間でのNVRAMの不整合をデータベース管理者に警告できます。

フェイルオーバーまたはブート リカバリーのあとは、NVFAIL状態が解消されるまでNFSクライアントはどのノードからもデータにアクセスできません。CIFSクライアントには影響はありません。

NFSボリュームまたはLUNへのアクセスに対するNVFAILの影響

NVFAIL状態は、起動時にONTAPがNVRAMエラーを検出した場合、MetroClusterスイッチオーバー処理が実行された場合、またはNVFAILオプションが設定されたボリュームのHAテイクオーバー処理中に発生します。起動時にエラーが検出されなければ、ファイル サービスは正常に開始されます。しかし、NVRAMエラーが検出された場合、またはディザスタ スイッチオーバーでNVFAILの処理が実行された場合、ONTAPはデータベース インスタンスの応答を停止します。

NVFAILオプションを有効にすると、起動時に次の表のいずれかのプロセスが開始されます。

状況

操作

ONTAPがNVRAMエラーを検出しなかった場合

ファイル サービスが通常どおり開始されます。

ONTAPがNVRAMエラーを検出した場合

  • データベースにアクセスしようとするNFSクライアントに古いファイル ハンドル(ESTALE)エラーが返されます。これにより、アプリケーションは応答を中断するか、クラッシュまたは停止します。

    その後、システム コンソールおよびログ ファイルにエラー メッセージが出力されます。

  • アプリケーションが再起動されると、データベースの妥当性が確認されていなくても、CIFSクライアントからのアクセスが可能になります。

    NFSクライアントの場合は、影響を受けたボリューム上のin-nvfailed-stateオプションをリセットするまでファイルにアクセスできません。

次のいずれかのパラメーターが使用されている場合:

  • dr-force-nvfailボリューム オプションが設定されている

  • force-nvfail-allスイッチオーバー コマンド オプションが設定されている

将来のディザスタ スイッチオーバーでNVFAIL処理を実行する予定がない場合は、スイッチオーバー後にdr-force-nvfailオプションを解除できます。NFSクライアントの場合は、影響を受けたボリューム上のin-nvfailed-stateオプションをリセットするまでファイルにアクセスできません。

force-nvfail-allオプションを使用すると、ディザスタ スイッチオーバー時に処理されるすべてのDRボリュームにdr-force-nvfailオプションが設定されます。

ONTAPがLUNを含むボリューム上でNVRAMエラーを検出した場合

そのボリュームのLUNがオフラインになります。ボリュームのin-nvfailed-stateオプションをクリアし、さらに影響を受けたボリュームの各LUNをオンラインにしてLUN上のNVFAIL属性をクリアする必要があります。LUNの整合性をチェックする手順を実行し、必要に応じてSnapshotコピーまたはバックアップからLUNをリカバリーすることができます。ボリューム内のすべてのLUNがリカバリーされたあと、影響を受けたボリュームのin-nvfailed-stateオプションがクリアされます。

データ損失イベントの監視用コマンド

NVFAILオプションを有効にすると、NVRAMの不整合が原因でシステム クラッシュが発生した場合、またはMetroClusterスイッチオーバーが発生した場合に、通知を受け取ることができます。

デフォルトでは、NVFAILパラメーターは無効になっています。

実行する処理

使用するコマンド

NVFAILを有効にして新しいボリュームを作成する

volume create -nvfail on

既存のボリュームでNVFAILを有効にする

volume modify

注: 作成されたボリュームでNVFAILを有効にするには、-nvfailオプションを「on」に設定します。

指定したボリュームでNVFAILが有効になっているかどうかを表示する

volume show

注: 指定したボリュームのNVFAIL属性を表示するには、-fieldsパラメーターを「nvfail」に設定します。

関連情報

詳細については、各コマンドのマニュアル ページを参照してください。

スイッチオーバー後のNVFAIL状態のボリュームへのアクセス

スイッチオーバー後、volume modifyコマンドの-in-nvfailed-stateパラメーターをリセットしてクライアントのデータ アクセス制限を解除し、NVFAIL状態をクリアする必要があります。

開始する前に

データベースまたはファイルシステムが実行されていないこと、または影響を受けるボリュームにアクセスしようとしていないことを確認します。

タスク概要

-in-nvfailed-stateパラメーターを設定するには、advanced権限レベルが必要です。

手順
  1. -in-nvfailed-stateパラメーターをfalseに設定してvolume modifyコマンドを使用し、ボリュームをリカバリーします。

終了後の操作

データベース ファイルの有効性を調べる手順については、使用しているデータベース ソフトウェアのマニュアルを参照してください。

データベースでLUNを使用している場合は、NVRAMの障害発生後にホストからLUNにアクセスできるようにする手順を確認してください。

スイッチオーバー後のNVFAIL状態にあるLUNのリカバリー

スイッチオーバーが発生すると、NVFAIL状態にあるLUN上のデータにホストがアクセスできなくなります。データベースがLUNにアクセスできるようにするには、いくつかの作業が必要です。

開始する前に

データベースが実行されていないことが必要です。

手順
  1. volume modifyコマンドの-in-nvfailed-stateパラメーターをリセットし、影響を受けた、LUNをホストするボリュームのNVFAIL状態をクリアします。

  2. 影響を受けたLUNをオンラインにします。

  3. LUNでデータの不整合の有無を確認し、これを解決します。

    これには、ホスト ベースのリカバリーを実行するか、SnapRestoreを使用してストレージ コントローラー上でリカバリーを実行します。

  4. LUNをリカバリーしたあと、データベース アプリケーションをオンラインにします。

Top of Page