ONTAP 9.13

to English version

2ノード クラスタでのテイクオーバーを伴わないノードの停止またはリブート

2ノード クラスタにおいて、ノードやシェルフで特定のハードウェア メンテナンスを実施する際にパートナー ノードを稼働させておくことでダウンタイムを抑えたい場合や、何らかの問題で手動テイクオーバーを実行できない状態でパートナー ノードのアグリゲートを稼働させてデータの提供を続けたい場合、テイクオーバーを開始せずにノードを停止またはリブートします。この手順は、富士通のサポートに問題のトラブルシューティングを依頼した場合に、その一環として実行するように求められることもあります。

タスク概要
  • テイクオーバーが発生しないように抑制(-inhibit-takeover true パラメーターを使用)する前に、クラスタHAを無効にします。

  • クラスタ HA は、2ノード クラスタの1つのノードで障害が発生してもクラスタが停止しないようにする機能です。-inhibit-takeover true パラメーターを使用する前にクラスタHAを無効にしておかないと、両方のノードでデータの提供が停止します。

  • クラスタHAを無効にせずにノードを停止またはリブートしようとすると、ONTAPから警告が表示され、クラスタHAを無効にするように指示されます。

  • オンラインのままにするパートナー ノードにLIF(論理インターフェイス)を移行します。

  • 停止またはリブートするノードに稼働したままにしたいアグリゲートがある場合は、それらをオンラインのままにするノードに移動します。

手順
  1. 両方のノードが正常に機能していることを確認します。
    cluster show

    両方のノードの Health 列に true と表示されます。

    cluster::> cluster show
    Node         Health  Eligibility
    ------------ ------- ------------
    node1        true     true
    node2        true     true
  2. 停止またはリブートするノードからパートナー ノードにすべてのLIFを移行します。
    network interface migrate-all -node node_name

  3. 停止またはリブートするノードにノードの停止時にオンラインのままにしておくアグリゲートがある場合は、それらをパートナー ノードに再配置します。それ以外の場合は、次の手順に進みます。

    1. 停止またはリブートするノードのアグリゲートを表示します。
      storage aggregates show -node node_name

      たとえば、node1が停止またはリブートするノードの場合、次のようになります。

      cluster::> storage aggregates show -node node1
      Aggregate  Size  Available  Used%  State  #Vols   Nodes   RAID  Status
      ---------  ----  ---------  -----  -----  -----   -----   ----  ------
      aggr0_node_1_0
                 744.9GB   32.68GB   96% online       2 node1    raid_dp,
                                                                      normal
      aggr1       2.91TB    2.62TB   10% online       8 node1    raid_dp,
                                                                      normal
      aggr2
                  4.36TB    3.74TB   14% online      12 node1    raid_dp,
                                                                      normal
      test2_aggr  2.18TB    2.18TB    0% online       7 node1    raid_dp,
                                                                      normal
      4 entries were displayed.
    2. アグリゲートをパートナー ノードに移動します。
      storage aggregate relocation start -node node_name -destination node_name -aggregate-list aggregate_name

      たとえば、アグリゲートaggr1、aggr2、およびtest2_aggrをnode1からnode2に移動します。

      storage aggregate relocation start -node node1 -destination node2 -aggregate-list aggr1,aggr2,test2_aggr

  4. クラスタHAを無効にします。
    cluster ha modify -configured false

    HAが無効になっていることを示す出力が返されます: Notice: HA is disabled

    この処理ではストレージ フェイルオーバーは無効になりません。
  5. 該当するコマンドを使用して、ターゲット ノードをテイクオーバーなしで停止またはリブートします。

    • system node halt -node node_name -inhibit-takeover true

    • system node reboot -node node_name -inhibit-takeover true

      コマンド出力に、処理を続行するかどうかを確認する警告が表示されます。続行するには y を入力します。
  6. オンラインのままのノードが健全な状態(パートナーは停止)であることを確認します。
    cluster show

    オンラインのノードの Health 列に true と表示されます。

    コマンド出力に、クラスタHAが構成されていないことを示す警告が表示されます。この警告は無視してかまいません。
  7. ノードの停止またはリブートに必要な操作を実行します。

  8. オフラインにしたノードをLOADERプロンプトからブートします。
    boot_ontap

  9. 両方のノードが正常に機能していることを確認します。
    cluster show

    両方のノードの Health 列に true と表示されます。

    コマンド出力に、クラスタHAが構成されていないことを示す警告が表示されます。この警告は無視してかまいません。
  10. クラスタHAを再度有効にします。
    cluster ha modify -configured true

  11. 前の手順でアグリゲートをパートナー ノードに再配置した場合は、それぞれのホーム ノードに戻します。それ以外の場合は、次の手順に進みます。
    storage aggregate relocation start -node node_name -destination node_name -aggregate-list aggregate_name

    たとえば、アグリゲートaggr1、aggr2、およびtest2_aggrをノードnode2からノードnode1に移動します。
    storage aggregate relocation start -node node2 -destination node1 -aggregate-list aggr1,aggr2,test2_aggr

  12. LIFをそれぞれのホーム ポートにリバートします。

    1. ホームにないLIFを表示します。
      network interface show -is-home false

    2. 停止したノードから移行したLIF以外にもホームにないLIFがある場合は、リバートする前に移動しても問題がないことを確認します。

    3. 問題がなければ、すべてのLIFをホームにリバートします。
      network interface revert *

Top of Page