リダイレクトI/Oでは、ディスクI/Oが一度別ノードを経由することからディスクI/O遅延を引き起こすものとなるため、通常はストレージ障害発生時に利用される。
今回実際に疑似的な障害を発生させ、リダイレクトI/Oが動作することを確認してみた。
Hyper-V環境
環境は以下の通りとなる。2台のWindows Server 2019のHyper-Vノードがあり、iSCSIのボリュームをCSVとして共有している環境を想定する。リダイレクトI/O動作時のディスクI/Oは以下図のとおりとなる。
リダイレクトI/Oの動作を確認してみる
ノード#1のiSCSI用のネットワークを切断した際に、リダイレクトI/Oが動作することを確認する。ネットワーク切断してからしばらくすると、以下イベントログが表示され、リダイレクトI/Oが動作したことを確認できた。
ソース:FailoverClusteringまた、ネットワーク切断からリダイレクトI/Oが動作するまでを時系列でまとめてみた。
id:5121
クラスターの共有ボリューム ‘Volume1’ (‘クラスター ディスク 1’) はこのクラスター ノードから直接アクセスできなくなりました。I/O アクセスは、ボリュームを所有するノードへのネットワークを介して記憶装置にリダイレクトされます。これが原因でパフォーマンスが低下した場合は、このノードから記憶装置への接続のトラブルシューティングを実施してください。記憶装置への接続が再確立されたら、I/O は正常な状態に戻ります。
発生時間 (秒) | 内容 | イベントログ |
---|---|---|
0 | iSCSI用のNICのリンクダウン発生 | ソース:e1iexpress id:27 |
10 | MPIOのフェイルオーバー失敗 | ソース:mpio id:32 |
140 | ディスクが取り外される | ソース:Disk id:157 |
140 | リダイレクトI/Oの開始 | ソース:FailoverClustering id:5121 |
PDORemovePeriod
で規定されている。これはPowerShellのGet-MPIOSetting
で確認することができる。※下記はNetApp社のユーティリティがインストールされた状態の値であり、Windowsデフォルト値ではないので注意。
PS C:\Users\tadmin\Desktop> Get-MPIOSetting
PathVerificationState : Disabled
PathVerificationPeriod : 30
PDORemovePeriod : 130
RetryCount : 6
RetryInterval : 1
UseCustomPathRecoveryTime : Enabled
CustomPathRecoveryTime : 40
DiskTimeoutValue : 60
ちなみに、ESXiではディスクの全パスダウン(APD : All Paths Down)の検知時間は、デフォルト140秒として設定されている。
0 件のコメント:
コメントを投稿