2018年8月22日水曜日

vCenter High Availability (vCenter HA) の設定手順とフェイルオーバー時間について


vCenter Server Appliance (vCSA) について、バージョン6.5以降より、vCenter High Availability (vCenter HA) と呼ばれる冗長化機能が利用できるようになった。ちなみに、vCenter Serverの高可用性の手法については、VMware社の以下KBにてまとめられている。

サポート対象の vCenter Server 高可用性オプション (1024051)
https://kb.vmware.com/s/article/1024051?lang=ja

今回、手順確認と動作確認を目的として、実際にvCSAを構築して、vCenter HAの設定をしてみた。また、実際にフェイルオーバーさせた際の、vCenter Serverが操作できなくなる時間をざっくり計測してみた。

実施環境

今回の環境は以下の通り。vCenter HAを構成する際は、通常のvCenter Serverへのアクセス用のネットワークとは別に、vCenter HA用のネットワーク(下図のオレンジ線)を用意する必要がある。


上図のように、vCenter HAでは、元のvCSA(アクティブノード)、フェイルオーバー用のvCSA(パッシブノード)、監視用のvCSA(監視ノード)の3台が必要となる。監視ノードがアクティブノードとパッシブノードにハートビートを送信し監視をする。

パッシブノードはアクティブノードと同一CPU、メモリ、ディスクが必要となる。監視用ノードは、メモリは1GBと少なく構成されるようだ。

vCenter HA設定手順

それではvCenter HAの設定手順を見ていこう。

1. vCenter HAの構成の開始

vSphere Web Clientにて、「vCenter Server」→「設定」→「vCenter HA」→「構成」ボタンを押下する。


2. 設定オプション

「基本」を選択する。


3. ネットワークアダプタの追加

vCenter HA用のNICに付与するIPアドレスと、ポートグループを指定する。今回は分散仮想スイッチのポートグループ「DPortGroup165」を指定している。


4. パッシブノードと監視ノードのIPアドレスの設定

パッシブノードと監視ノードのIPアドレスとして、前手順でアクティブノードに設定したIPアドレスと同一セグメントにて設定する。


5. デプロイ構成の選択

デプロイされる際の構成が表示される。今回は検証環境の制約により、これといって選択できる項目はなかった。なお、赤丸で示した「互換性の警告」は、可用性を担保するうえで問題となる構成があることを表している。


今回の互換性の警告としては、データストアがすべて同一となってしまっていることと、データストアの空き容量が不足しているという2点となっていた。実際にデータストアの空き容量不足により、一度パッシブノードの展開に失敗してしまったため、データストアの容量を増やしてやり直しをすることになってしまった。


6. 設定の確認

最後に設定の確認が表示されるので、問題なければ「完了」ボタンを押下する。


「最近のタスク」にデプロイやクローン作成の進捗が表示されるので、完了までしばらく待機する。なお、私の環境では8分程度で完了した。


7. vCenter HA構成後の確認

vCenter HAの構成タスクが完了しても、フェイルオーバーが無効となっている旨の以下メッセージが表示される。

------------------------------
現在、レプリケーションで障害が発生している可能性があります。自動フェイルオーバー保護は無効です。vCenter HA を有効にして間もない場合は、最初のレプリケーションがまだ進行中で、あと数分かかる状態である可能性があります。
------------------------------


慌てずに1分程度待機すれば、これは解消される。


フェイルオーバー時間

vCenter HAは手動でフェイルオーバーさせることができるので、実際にフェイルオーバーを実行して、その際の切り替わり時間を計測してみることにする。

vCenter HAの設定画面の右上の「フェイルオーバー開始」ボタンを押下する。確認のダイアログボックスが表示されるので、「はい」を押下する。


0分経過

Ping疎通が途絶える

1分経過

Ping疎通が回復

2分経過

vCSAの管理Webにアクセスすると、「503 Service Unavailable」エラーが返ってくる


4分経過

Web画面は回復したが、vSphere Web Clientを表示しようとすると、「Failover in progress...」の表示となり、まだ操作はできない


7分経過

「The vSphere Client web server is initializing」の画面となり、相変わらず操作はできない


8分経過

vSphere Web Clientにログインできるようになる

というわけで、vCenter HAを構成していたとしても、数分間の操作不能の時間が発生するので注意が必要となる。

なお、フェイルオーバー後にvCenter HAの画面を確認すると、アクティブノードとパッシブノードのIPアドレスが入れ替わっている。


管理Web用のIPアドレス(今回の場合、192.168.11.165)は、パッシブノード側に付与されていることがわかる。


まとめ

vCenter HAはフェイルオーバー時に数分レベルの切り替わり時間が発生し、その間は管理Webのアクセスが不能となることがわかった。

vSphere HAによる仮想マシン再起動でも数分あればvCSAは起動できることから、2倍以上のCPU、メモリリソースを消費するほどのメリットがvCenter HAにはないと感じてしまう。さらに、vCenter Server自体の機能は、仮想マシンの稼働に影響を与えることはなく、緊急性という観点でも、vSphere HAによる再起動で十分な場合が多いだろう。

では、どのような場合にvCenter HAを使う必要があるのだろうか?以下URLに「vCenter High Availability (vCenter HA) は、ホストとハードウェアの障害に加え、vCenter Server アプリケーションの障害からの保護にも対応」とある。

vCenter High Availability を使用した vCenter Server Appliance の保護
https://docs.vmware.com/jp/VMware-vSphere/6.5/com.vmware.vsphere.avail.doc/GUID-226A925F-BF20-4A58-BF15-4A76B4CEDC84.html

従来のvSphere HAによる保護の場合は、アプリケーションの状態は監視できないため、vCenter Serverのアプリケーション障害時のフェイルオーバーを実現したい場合には、vCenter HAの構成を検討する必要はあると思われる。

0 件のコメント:

コメントを投稿

人気の投稿