2013年1月31日木曜日

Zabbix 監視機能 (死活監視設定編)

こんにちは。サイオステクノロジーの小川です。

本題に入る前に、前回書いた記事では Zabbix 2.0.3 のテスト版 RPM パッケージを使用したインストールを行ないましたが、その後 12 月 8 日に Zabbix 2.0.4 がリリースされました。2.0.4 のテスト版 RPM パッケージは こちらのページにアップロードされています。

修正内容は Zabbixオフィシャルサイトの「ZABBIX 2.0.4」に、新機能に関する情報は、Zabbix の公式ドキュメントの「9 What's new in Zabbix 2.0.4」に掲載されています。新機能の主な内容としては、Webフロントエンドや API、Zabbix のデーモンの改善があります。今後 Zabbix の新機能やアップデートがあった際に試して紹介できれば、と考えています。

さて、本記事より Zabbix の監視設定を紹介していきます。Zabbix にはいくつか監視機能がありますが、今回はその中から死活監視の設定方法から動作確認までを行います。Zabbix 2.0.3 を使用しています。

  • Zabbix 監視設定

  • 1. ホストの設定

    Zabbix コントロールパネルから 設定 -> ホスト -> 「ホストの作成」ボタンをクリックしホストの設定を行います。

    「ホストの設定」画面が表示されるので、以下の設定をします。

    * ホスト名
    監視対象のホスト名を指定。

    * 表示名
    Zabbix 管理者コンソールで表示させる名前を指定。

    * グループ
    監視対象ホストが所属するグループを指定。今回は「Linux servers」を指定。

    * エージェントのインターフェース
    監視対象を特定する為の IP アドレスまたは DNS 名を指定する。今回は IP アドレスを指定し、接続方法は IP アドレスに設定。

    設定が完了しましたら「保存」ボタンをクリックします。

    「ホストを追加しました」というメッセージが表示されればホストの登録は完了です。

    2. アイテムの設定

    「アイテム(0)」のリンク -> 「アイテムの作成」ボタンからアイテムの設定を行います。

    「アイテムの設定」画面で以下の設定をします。

    * アイテム名
    任意のアイテムの名前を指定。今回は例として「死活監視」とした。

    * タイプ
    監視方法を選択する。今回は ping で死活監視を行うので「シンプルチェック」を選択。

    * キー
    icmpping[<target>,<packets>,<interval>,<size>,<timeout>] を選択。今回は監視の target を 192.168.122.111 としたので "icmpping[192.168.122.111]" を設定した。それ以外はデフォルトの設定の為省略。


    設定が完了しましたら「保存」ボタンをクリックします。

    「アイテムを追加しました」とメッセージが表示されればアイテムの設定は完了です。

    3. トリガーの設定

    「トリガー(0)」のリンク -> 「トリガーの作成」ボタンをクリックしトリガーの設定を行います。


    「トリガーの設定」画面で以下の設定をします。

    * 名前
    任意のトリガーの名前を指定。今回は「死活監視」とした。

    * 条件式
    障害検知する条件式を設定。
    今回はホスト名 h01 に設定されているアイテム icmpping[192.168.122.111] の最新の値 (last(0)) が 1 でない場合は障害検知する設定とした。

    * 深刻度
    任意で障害の深刻度を選択。今回は「重度の障害」を選択した。

    設定が完了しましたら「保存」ボタンをクリックします。

    以上で設定は完了です。続いて動作確認をしてみます。

  • 動作確認

  • 1. 障害検知

    監視対象ホストをネットワークから切断し、Zabbix が障害検知することを確認します。

    Zabbix の Web UI の「ダッシュボード」を確認すると障害が発生していることが一目で分かります。

    監視データ -> イベント から障害発生時刻の詳細を確認できます。

    「最新のデータ」を確認すると、以下の画面のように「最新の値」が 0 になっており、監視対象ホストとの ping の疎通がとれていないことが分かります。

    グラフで監視対象ホストの状況を確認すると、値は 1 から 0 になっており ping の疎通がとれていないことが確認できます。

    2. 障害の復旧

    監視対象ホストをネットワークに接続すると正常稼働の状態に戻ります。

    「最新データ」の「最新の値」が 1 になります。

    「イベント」を確認すると「ステータス」が正常の状態になります。

    グラフを確認すると、値が 0 から 1 の状態となり ping の疎通がとれていることが分かります。

    以上で死活監視の設定と動作確認は完了です。

    次回は Linux サーバ上で動くアプリケーションの監視設定の紹介をする予定です。

    0 件のコメント:

    コメントを投稿