2022年3月12日土曜日

Zabbix 6.0でサービスとSLAを設定する

Zabbix 6.0からWeb GUIのメニューに変更があり、「サービス」というメニューが追加された。メニューを展開すると、「サービス」と「SLA」というメニューが確認できる。

Zabbix 6.0より前においても、「サービス」の監視は実施することができたが、今回「SLA」が新たに追加されている。これらの設定することで、監視対象のサービスに定められたSLA (Service Level Agreement) の遵守状況を、実際のシステムの監視状況と紐づけて監視できる

本記事では、Zabbix 6.0にてサービスおよびSLAを設定する手順を記載する。

環境

環境は以下の通り。

  • OS : CentOS Stream 8
  • Zabbix : 6.0.0

手順

1. トリガーにタグを設定

まずはサービスの停止状態に関連する監視のトリガーに対してタグを設定する。

なお、Zabbix 6.0以前はサービスやSLAの設定は「タグ」ではなく「トリガー」で設定していたが、6.0になってから柔軟にサービスとSLAを設定できるように、タグを用いて設定する方式に変更となったようだ。

左メニューの「テンプレート」から対象となるテンプレートおよびトリガーを選択するが、今回は例としてテンプレート「Template Module ICMP Ping」のトリガー「Unavailable by ICMP ping」に対してタグを設定する。

トリガーを選択し「タグ」タブを選択する。タグは名前(Key)と値(Value)の組み合わせで設定する。今回は以下の通り設定した。

項目 設定項目
名前 Service
Down

2. サービスを作成

左メニューの「サービス」からサービスを作成するが、通常では右上ボタンが「ビュー」表示になっており作成や変更することができないため、右上ボタンを「変更」にしたうえで、「サービスの作成」を選択する。

サービスは、最低限名前と先ほどトリガーに設定したタグを指定すればよい。

項目 設定項目
名前 Service-Down
障害タグ Service等しいDown

このあとSLAの設定に必要となるため、サービスには以下の通りタグも設定しておく。

項目 設定項目
名前 Service
Service-Down

3. SLAを作成

左メニューの「SLA」からSLAを作成する。

SLAは以下の通り設定する。あくまで設定例となるため、環境や要件に合わせてSLOやレポート期間は適切に設定しよう。

項目 設定項目
名前 SLA-Down
SLO (Service Level Objective) 99.99%
レポート期間 毎月
発効日 デフォルトで作成日が設定されるため、そのままとする。
障害タグ Service等しいService-Down

4. 動作確認

それでは実際に監視対象ホストを停止した際に、SLAが低下することを確認しよう。

監視対象ホストを停止すると、トリガー「Unavailable by ICMP ping」がトリガーされていることがわかる

次に、左メニューの「SLA」から先ほど作成したSLA「SLA-Down」にある「SLAレポート」のリンクを選択する。

SLAレポート画面が表示され、SLAに対して実際の稼働率が下がっていることがわかる。

さらに各サービスを選択すると、実際のアップタイムおよびダウンタイムの詳細な時間を確認することができる。

また、ダッシュボードにも追加して表示させることができる。

以上で、Zabbix 6.0にてサービスおよびSLAを設定する手順は完了となる。

参考

0 件のコメント:

コメントを投稿

人気の投稿