ONTAP 9 マニュアル ( CA08871-402 )
CLIを使用したONTAPの手動無停止アップグレード(標準構成)
ONTAP System Managerを使用した自動アップグレードが推奨されるアップグレード方法です。 ONTAP System Managerでサポートされない構成の場合は、ONTAPコマンドライン インターフェイス(CLI)を使用して手動無停止アップグレードを実行できます。 手動無停止アップグレードを使用して2つ以上のノードのクラスタをアップグレードするには、HAペアの各ノードでフェイルオーバー処理を開始し、フェイルオーバー元の(「障害
」)ノードを更新してからギブバックを開始します。この処理をクラスタ内のそれぞれのHAペアに対して繰り返す必要があります。
アップグレード前の必要な準備作業を完了しておく必要があります。
HAペアの最初のノードの更新
ノードのパートナーによるテイクオーバーを開始することで、HAペアの最初のノードを更新できます。最初のノードをアップグレードしている間、ノードのデータはパートナーから提供されます。
メジャー アップグレードを実行する場合は、外部接続用にデータLIFを設定し、最初のONTAPイメージをインストールしたノードをアップグレード対象の最初のノードにする必要があります。
最初のノードをアップグレードしたら、できるだけ迅速にパートナー ノードをアップグレードする必要があります。必要以上に長い間、2つのノードで複数のバージョンが混在する状態にしておかないでください。
-
AutoSupportメッセージを呼び出して、クラスタ内の最初のノードを更新します。
autosupport invoke -node * -type all -message "Starting_NDU"
このAutoSupport通知には、更新直前のシステム ステータスの記録が含まれています。これにより、更新処理で問題が発生した場合に役立つトラブルシューティング情報が保存されます。
AutoSupportメッセージを送信するようにクラスタが設定されていない場合は、通知のコピーがローカルに保存されます。
-
権限レベルをadvancedに設定します。続行するかを尋ねられたら、「y」と入力します。
set -privilege advanced
advancedのプロンプト(
*>
)が表示されます。 -
新しいONTAPソフトウェア イメージをデフォルトのイメージとして設定します。
system image modify {-node nodenameA -iscurrent false} -isdefault true
system image modifyコマンドは、拡張クエリを使用して、代替イメージとしてインストールされるターゲットのONTAPソフトウェア イメージが各ノードのデフォルトのイメージになるように変更します。
-
更新の進行状況を監視します。
system node upgrade-revert show
-
新しいONTAPソフトウェア イメージがデフォルトのイメージとして設定されたことを確認します。
system image show
次の例では、image2が新しいONTAPバージョンで、node0のデフォルトのバージョンとして設定されています。
cluster1::*> system image show Is Is Install Node Image Default Current Version Date -------- ------- ------- ------- --------- ------------------- node0 image1 false true X.X.X MM/DD/YYYY TIME image2 true false Y.Y.Y MM/DD/YYYY TIME node1 image1 true true X.X.X MM/DD/YYYY TIME image2 false false Y.Y.Y MM/DD/YYYY TIME 4 entries were displayed.
-
パートナー ノードで自動ギブバックが有効になっている場合は、無効にします。
storage failover modify -node nodenameB -auto-giveback false
2ノード クラスタでは、自動ギブバックを無効にすると、2つのノードで交互に障害が発生した場合に管理クラスタのサービスがオンラインにならないことを警告するメッセージが表示されます。「
y
」と入力して、作業を続けます。 -
ノードのパートナーの自動ギブバックが無効になっていることを確認します。
storage failover show -node nodenameB -fields auto-giveback
cluster1::> storage failover show -node node1 -fields auto-giveback node auto-giveback -------- ------------- node1 false 1 entry was displayed.
-
次のコマンドを2回実行して、更新対象のノードが現在クライアントに対して処理を行っているかを確認します。
system node run -node nodenameA -command uptime
uptimeコマンドでは、ノードの前回のブート以降にNFS、SMB、FC、iSCSIの各クライアントに対してノードが実行した処理の総数が表示されます。プロトコルごとにコマンドを2回実行して、処理数が増加しているかを確認する必要があります。増加している場合は、そのプロトコルのクライアントに対してノードが現在処理を行っています。増加していない場合は、そのプロトコルのクライアントに対してノードは現在処理を行っていません。
ノードの更新後にクライアント トラフィックが再開したことを確認できるように、クライアントの処理数が増加しているプロトコルをすべて書き留めてください。 次の例は、NFS、SMB、FC、およびiSCSIの処理が検出されたノードを示しています。ただし、ノードは現在NFSクライアントとiSCSIクライアントに対してのみ処理を行っています。
cluster1::> system node run -node node0 -command uptime 2:58pm up 7 days, 19:16 800000260 NFS ops, 1017333 CIFS ops, 0 HTTP ops, 40395 FCP ops, 32810 iSCSI ops cluster1::> system node run -node node0 -command uptime 2:58pm up 7 days, 19:17 800001573 NFS ops, 1017333 CIFS ops, 0 HTTP ops, 40395 FCP ops, 32815 iSCSI ops
-
ノードからすべてのデータLIFを移行します。
network interface migrate-all -node nodenameA
-
移行したLIFを確認します。
network interface show
LIFのステータスの確認に使用できるパラメーターの詳細については、network interface showのマニュアル ページを参照してください。
次の例は、node0のデータLIFが正常に移行されたことを示しています。それぞれのLIFについて、この例に含まれるフィールドを使用して、LIFのホーム ノードとポート、LIFの移行先である現在のノードとポート、およびLIFの動作ステータスと管理ステータスを確認できます。
cluster1::> network interface show -data-protocol nfs|cifs -role data -home-node node0 -fields home-node,curr-node,curr-port,home-port,status-admin,status-oper vserver lif home-node home-port curr-node curr-port status-oper status-admin ------- ------- --------- --------- --------- --------- ----------- ------------ vs0 data001 node0 e0a node1 e0a up up vs0 data002 node0 e0b node1 e0b up up vs0 data003 node0 e0b node1 e0b up up vs0 data004 node0 e0a node1 e0a up up 4 entries were displayed.
-
テイクオーバーを開始します。
storage failover takeover -ofnode nodenameA
テイクオーバーするノードを新しいソフトウェア イメージでブートするには通常のテイクオーバーが必要なため、-option immediateパラメーターは指定しないでください。ノードからLIFを手動で移行しなかった場合は、LIFがノードのHAパートナーに自動的に移行されるため、サービスが停止することはありません。
最初のノードがブートし、Waiting for giveback状態になります。
AutoSupportが有効な場合は、ノードがクラスタ クォーラムのメンバーでないことを示すAutoSupportメッセージが送信されます。この通知を無視し、更新を続行してかまいません。 -
テイクオーバーが正常に完了したことを確認します。
storage failover show
バージョン不一致およびメールボックス形式の問題を示すエラー メッセージが表示される可能性があります。これは想定どおりの動作です。無停止メジャー アップグレードにおける一時的な状態を表しており、悪影響はありません。
次の例は、テイクオーバーが正常に完了したことを示しています。ノードnode0の状態はWaiting for giveback、パートナーの状態はIn takeoverになっています。
cluster1::> storage failover show Takeover Node Partner Possible State Description -------------- -------------- -------- ------------------------------------- node0 node1 - Waiting for giveback (HA mailboxes) node1 node0 false In takeover 2 entries were displayed.
-
次の状態になるまで最低8分待ちます。
-
クライアントのマルチパス(導入している場合)が安定している。
-
クライアントがテイクオーバー中に発生したI/O処理の中断から回復している。
回復までの時間はクライアントによって異なり、クライアント アプリケーションの特性によっては8分以上かかることもあります。
-
-
アグリゲートを最初のノードに戻します。
storage failover giveback –ofnode nodenameA
ギブバックでは、最初にルート アグリゲートをパートナー ノードに戻し、そのノードのブートが完了すると、ルート以外のアグリゲートと自動的にリバートするように設定されたすべてのLIFを戻します。新しくブートしたノードで、戻されたアグリゲートから順番にクライアントへのデータ提供が開始されます。
-
すべてのアグリゲートが戻されたことを確認します。
storage failover show-giveback
Giveback Statusフィールドにギブバックするアグリゲートがないことが示されている場合は、すべてのアグリゲートが戻されています。ギブバックが拒否された場合は、コマンドによってギブバックの進捗が表示され、拒否したサブシステムも表示されます。
-
いずれかのアグリゲートが戻されていない場合は、次の手順を実行します。
-
拒否の対処方法を確認して、「
拒否
」状態に対処するか、拒否を無視するかを指定します。 -
必要に応じて、エラー メッセージに示された「
拒否
」状態に対処して、特定された処理が正常に終了するようにします。 -
storage failover givebackコマンドを再実行します。
「
拒否
」状態を無視する場合は、-override-vetoesパラメーターをtrueに設定します。
-
-
次の状態になるまで最低8分待ちます。
-
クライアントのマルチパス(導入している場合)が安定している。
-
クライアントがギブバック中に発生したI/O処理の中断から回復している。
回復までの時間はクライアントによって異なり、クライアント アプリケーションの特性によっては8分以上かかることもあります。
-
-
ノードの更新が正常に完了したことを確認します。
-
advanced権限レベルに切り替えます。
set -privilege advanced
-
ノードの更新ステータスが完了になっていることを確認します。
system node upgrade-revert show -node nodenameA
ステータスがcompleteと表示される必要があります。
ステータスがcompleteと表示されない場合は、弊社サポートにお問い合わせください。
-
admin権限レベルに戻ります。
set -privilege admin
-
-
ノードのポートが動作していることを確認します。
network port show -node nodenameA
このコマンドは、ONTAP 9の上位バージョンにアップグレードされたノードで実行する必要があります。
次の例は、ノードのすべてのポートが動作していることを示しています。
cluster1::> network port show -node node0 Speed (Mbps) Node Port IPspace Broadcast Domain Link MTU Admin/Oper ------ --------- ------------ ---------------- ----- ------- ------------ node0 e0M Default - up 1500 auto/100 e0a Default - up 1500 auto/1000 e0b Default - up 1500 auto/1000 e1a Cluster Cluster up 9000 auto/10000 e1b Cluster Cluster up 9000 auto/10000 5 entries were displayed.
-
LIFをノードにリバートします。
network interface revert *
このコマンドを実行すると、移行したLIFが元のノードに戻されます。
cluster1::> network interface revert * 8 entries were acted on.
-
ノードのデータLIFが正常にノードにリバートされ、動作していることを確認します。
network interface show
次の例は、ノードがホストするすべてのデータLIFが正常にノードにリバートされ、動作ステータスが「up」になっていることを示しています。
cluster1::> network interface show Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ---------- ---------- ------------------ ------------- ------- ---- vs0 data001 up/up 192.0.2.120/24 node0 e0a true data002 up/up 192.0.2.121/24 node0 e0b true data003 up/up 192.0.2.122/24 node0 e0b true data004 up/up 192.0.2.123/24 node0 e0a true 4 entries were displayed.
-
前の手順でこのノードがクライアントに対して処理を行っていることを確認した場合は、その時点で処理を行っていたプロトコルごとに、ノードがサービスを提供していることを確認します。
system node run -node nodenameA -command uptime
更新中に、処理数はゼロにリセットされます。
次の例は、更新したノードがNFSクライアントとiSCSIクライアントに対する処理を再開していることを示しています。
cluster1::> system node run -node node0 -command uptime 3:15pm up 0 days, 0:16 129 NFS ops, 0 CIFS ops, 0 HTTP ops, 0 FCP ops, 2 iSCSI ops
-
前の手順でパートナー ノードの自動ギブバックを無効にした場合は、再度有効にします。
storage failover modify -node nodenameB -auto-giveback true
できるだけ早くノードのHAパートナーの更新に進んでください。何らかの理由で更新プロセスを中断する必要がある場合は、HAペアの両方のノードで同じバージョンのONTAPを実行する必要があります。
HAペアのパートナー ノードの更新
HAペアの最初のノードを更新したあとは、そのノードでテイクオーバーを開始してパートナーを更新します。パートナーをアップグレードしている間、パートナーのデータは最初のノードから提供されます。
-
権限レベルをadvancedに設定します。続行するかを尋ねられたら、「y」と入力します。
set -privilege advanced
advancedのプロンプト(
*>
)が表示されます。 -
新しいONTAPソフトウェア イメージをデフォルトのイメージとして設定します。
system image modify {-node nodenameB -iscurrent false} -isdefault true
system image modifyコマンドでは、拡張クエリを使用して、代替イメージとしてインストールされるターゲットのONTAPソフトウェア イメージが各ノードのデフォルトのイメージになるように変更します。
-
更新の進行状況を監視します。
system node upgrade-revert show
-
新しいONTAPソフトウェア イメージがデフォルトのイメージとして設定されたことを確認します。
system image show
次の例では、
image2
が新しいONTAPバージョンで、ノードのデフォルトのイメージとして設定されています。cluster1::*> system image show Is Is Install Node Image Default Current Version Date -------- ------- ------- ------- --------- ------------------- node0 image1 false false X.X.X MM/DD/YYYY TIME image2 true true Y.Y.Y MM/DD/YYYY TIME node1 image1 false true X.X.X MM/DD/YYYY TIME image2 true false Y.Y.Y MM/DD/YYYY TIME 4 entries were displayed.
-
パートナー ノードで自動ギブバックが有効になっている場合は、無効にします。
storage failover modify -node nodenameA -auto-giveback false
2ノード クラスタでは、自動ギブバックを無効にすると、2つのノードで交互に障害が発生した場合に管理クラスタのサービスがオンラインにならないことを警告するメッセージが表示されます。「
y
」と入力して、作業を続けます。 -
パートナー ノードの自動ギブバックが無効になっていることを確認します。
storage failover show -node nodenameA -fields auto-giveback
cluster1::> storage failover show -node node0 -fields auto-giveback node auto-giveback -------- ------------- node0 false 1 entry was displayed.
-
次のコマンドを2回実行して、更新対象のノードが現在クライアントに対して処理を行っているかを確認します。
system node run -node nodenameB -command uptime
uptimeコマンドでは、ノードの前回のブート以降にNFS、SMB、FC、iSCSIの各クライアントに対してノードが実行した処理の総数が表示されます。プロトコルごとにコマンドを2回実行して、処理数が増加しているかを確認する必要があります。増加している場合は、そのプロトコルのクライアントに対してノードが現在処理を行っています。増加していない場合は、そのプロトコルのクライアントに対してノードは現在処理を行っていません。
注:ノードの更新後にクライアント トラフィックが再開したことを確認できるように、クライアントの処理数が増加しているプロトコルをすべて書き留めてください。
次の例は、NFS、SMB、FC、およびiSCSIの処理が検出されたノードを示しています。ただし、ノードは現在NFSクライアントとiSCSIクライアントに対してのみ処理を行っています。
cluster1::> system node run -node node1 -command uptime 2:58pm up 7 days, 19:16 800000260 NFS ops, 1017333 CIFS ops, 0 HTTP ops, 40395 FCP ops, 32810 iSCSI ops cluster1::> system node run -node node1 -command uptime 2:58pm up 7 days, 19:17 800001573 NFS ops, 1017333 CIFS ops, 0 HTTP ops, 40395 FCP ops, 32815 iSCSI ops
-
ノードからすべてのデータLIFを移行します。
network interface migrate-all -node nodenameB
-
移行したLIFのステータスを確認します。
network interface show
LIFのステータスの確認に使用できるパラメーターの詳細については、network interface showのマニュアル ページを参照してください。
次の例は、node1のデータLIFが正常に移行されたことを示しています。それぞれのLIFについて、この例に含まれるフィールドを使用して、LIFのホーム ノードとポート、LIFの移行先である現在のノードとポート、およびLIFの動作ステータスと管理ステータスを確認できます。
cluster1::> network interface show -data-protocol nfs|cifs -role data -home-node node1 -fields home-node,curr-node,curr-port,home-port,status-admin,status-oper vserver lif home-node home-port curr-node curr-port status-oper status-admin ------- ------- --------- --------- --------- --------- ----------- ------------ vs0 data001 node1 e0a node0 e0a up up vs0 data002 node1 e0b node0 e0b up up vs0 data003 node1 e0b node0 e0b up up vs0 data004 node1 e0a node0 e0a up up 4 entries were displayed.
-
テイクオーバーを開始します。
storage failover takeover -ofnode nodenameB -option allow-version-mismatch
テイクオーバーするノードを新しいソフトウェア イメージでブートするには通常のテイクオーバーが必要なため、-option immediateパラメーターは指定しないでください。ノードからLIFを手動で移行しなかった場合は、LIFがノードのHAパートナーに自動的に移行されるため、サービスが停止することはありません。
警告メッセージが表示されます。続行するには、「
y
」と入力する必要があります。テイクオーバーされたノードがブートし、Waiting for giveback状態になります。
AutoSupportが有効な場合は、ノードがクラスタ クォーラムのメンバーでないことを示すAutoSupportメッセージが送信されます。この通知を無視し、更新を続行してかまいません。 -
テイクオーバーが正常に完了したことを確認します。
storage failover show
次の例は、テイクオーバーが正常に完了したことを示しています。ノードnode1の状態はWaiting for giveback、パートナーの状態はIn takeoverになっています。
cluster1::> storage failover show Takeover Node Partner Possible State Description -------------- -------------- -------- ------------------------------------- node0 node1 - In takeover node1 node0 false Waiting for giveback (HA mailboxes) 2 entries were displayed.
-
次の状態になるまで最低8分待ちます。 +
-
クライアントのマルチパス(導入している場合)が安定している。
-
クライアントがテイクオーバー中に発生したI/Oの中断から回復している。
回復までの時間はクライアントによって異なり、クライアント アプリケーションの特性によっては8分以上かかることもあります。
-
-
アグリゲートをパートナー ノードに戻します。
storage failover giveback -ofnode nodenameB
ギブバック処理では、最初にルート アグリゲートがノードに戻され、そのノードのブートが完了すると、ルート以外のアグリゲートと自動的にリバートするように設定されたすべてのLIFが戻されます。新しくブートしたノードで、戻されたアグリゲートから順番にクライアントへのデータ提供が開始されます。
-
すべてのアグリゲートが戻されたことを確認します。
storage failover show-giveback
Giveback Statusフィールドにギブバックするアグリゲートがないことが示されている場合は、すべてのアグリゲートが戻されています。ギブバックが拒否された場合は、コマンドによってギブバックの進捗が表示され、ギブバック処理を拒否したサブシステムも表示されます。
-
いずれかのアグリゲートが戻されていない場合は、次の手順を実行します。
-
拒否の対処方法を確認して、「
拒否
」状態に対処するか、拒否を無視するかを指定します。 -
必要に応じて、エラー メッセージに示された「
拒否
」状態に対処して、特定された処理が正常に終了するようにします。 -
storage failover givebackコマンドを再実行します。
「
拒否
」状態を無視する場合は、-override-vetoesパラメーターをtrueに設定します。
-
-
次の状態になるまで最低8分待ちます。
-
クライアントのマルチパス(導入している場合)が安定している。
-
クライアントがギブバック中に発生したI/O処理の中断から回復している。
回復までの時間はクライアントによって異なり、クライアント アプリケーションの特性によっては8分以上かかることもあります。
-
-
ノードの更新が正常に完了したことを確認します。
-
advanced権限レベルに切り替えます。
set -privilege advanced
-
ノードの更新ステータスが完了になっていることを確認します。
system node upgrade-revert show -node nodenameB
ステータスがcompleteと表示される必要があります。
ステータスがcompleteになっていない場合は、ノードからsystem node upgrade-revert upgradeコマンドを実行します。このコマンドを実行しても更新が完了しない場合は、すぐに弊社サポートにお問い合わせください。
-
admin権限レベルに戻ります。
set -privilege admin
-
-
ノードのポートが動作していることを確認します。
network port show -node nodenameB
次の例は、ノードのすべてのデータポートが動作していることを示しています。
cluster1::> network port show -node node1 Speed (Mbps) Node Port IPspace Broadcast Domain Link MTU Admin/Oper ------ --------- ------------ ---------------- ----- ------- ------------ node1 e0M Default - up 1500 auto/100 e0a Default - up 1500 auto/1000 e0b Default - up 1500 auto/1000 e1a Cluster Cluster up 9000 auto/10000 e1b Cluster Cluster up 9000 auto/10000 5 entries were displayed.
-
LIFをノードにリバートします。
network interface revert *
このコマンドを実行すると、移行したLIFが元のノードに戻されます。
cluster1::> network interface revert * 8 entries were acted on.
-
ノードのデータLIFが正常にノードにリバートされ、動作していることを確認します。
network interface show
次の例は、ノードがホストするすべてのデータLIFが正常にノードにリバートされ、動作ステータスが「up」になっていることを示しています。
cluster1::> network interface show Logical Status Network Current Current Is Vserver Interface Admin/Oper Address/Mask Node Port Home ----------- ---------- ---------- ------------------ ------------- ------- ---- vs0 data001 up/up 192.0.2.120/24 node1 e0a true data002 up/up 192.0.2.121/24 node1 e0b true data003 up/up 192.0.2.122/24 node1 e0b true data004 up/up 192.0.2.123/24 node1 e0a true 4 entries were displayed.
-
前の手順でこのノードがクライアントに対して処理を行っていることを確認した場合は、その時点で処理を行っていたプロトコルごとに、ノードがサービスを提供していることを確認します。
system node run -node nodenameB -command uptime
更新中に、処理数はゼロにリセットされます。
次の例は、更新したノードがNFSクライアントとiSCSIクライアントに対する処理を再開していることを示しています。
cluster1::> system node run -node node1 -command uptime 3:15pm up 0 days, 0:16 129 NFS ops, 0 CIFS ops, 0 HTTP ops, 0 FCP ops, 2 iSCSI ops
-
これがクラスタ内で更新する最後のノードであった場合は、AutoSupport通知を発行します。
autosupport invoke -node * -type all -message "Finishing_NDU"
このAutoSupport通知には、更新直前のシステム ステータスの記録が含まれています。これにより、更新処理で問題が発生した場合に役立つトラブルシューティング情報が保存されます。
AutoSupportメッセージを送信するようにクラスタが設定されていない場合は、通知のコピーがローカルに保存されます。
-
HAペアの両方のノードで新しいONTAPソフトウェアが実行されていることを確認します。
set -privilege advanced
system node image show
次の例では、image2がONTAPの更新されたバージョンで、両方のノードのデフォルトのバージョンになっています。
cluster1::*> system node image show Is Is Install Node Image Default Current Version Date -------- ------- ------- ------- --------- ------------------- node0 image1 false false X.X.X MM/DD/YYYY TIME image2 true true Y.Y.Y MM/DD/YYYY TIME node1 image1 false false X.X.X MM/DD/YYYY TIME image2 true true Y.Y.Y MM/DD/YYYY TIME 4 entries were displayed.
-
前の手順でパートナー ノードの自動ギブバックを無効にした場合は、再度有効にします。
storage failover modify -node nodenameA -auto-giveback true
-
cluster show
コマンドとcluster ring show
コマンド(advanced権限レベル)を使用して、クラスタがクォーラムにあること、およびサービスが実行されていることを確認します。追加のHAペアをアップグレードする前にこの操作を行ってください。
-
admin権限レベルに戻ります。
set -privilege admin
-
追加のHAペアがある場合はアップグレードします。