現在、弊社運用サーバの24時間365日監視を一手に担っているサーバ監視システムをご紹介いたします。
OSSの監視ツールは多数あり、検証した事もありましたが
もっと簡潔明瞭でスッキリしたシステムが欲しい!という事で自社制作しました。
基本コンセプトはこんな感じ!
・サーバ、エージェント構成
・サーバ、エージェント共に専用アプリケーション等のインストール不要
・LAMP、LAPP環境で動作
・webシステムとして動作し、各設定もweb上で完結
・負荷管理は別システムで管理しているので除外
仕事の合間にせっせと作り込み、こんな感じに仕上がりました!
がっつりと本番設定入れちゃってるので、各所にモザイク入ってます・・・
1)ログイン画面
シンプル イズ ベスト
2)監視状況一覧
各監視先と現在の監視結果ステータスの一覧を表示します。
3)拠点一覧
拠点単位での監視対象の有効・無効、編集等が出来ます。
一括または個別に監視の有効・無効を切替可能。切り替えは1クリックでOK。
4)監視先の登録
依存先設定は、より上位の監視対象と紐付ける事で親子関係を作り、親となるデバイスがダウンした際に子を監視対象から外します。
こうする事で、不要なダウン通知の送信やサーバリソースを節約できます。
5)監視サービス一覧
監視するサービスの一覧です。
監視サービスは自由に追加可能で、タイムアウトや通知間隔も自由に変えられます
6)監視ログ一覧
監視結果のログを確認できます。
今のところ日付検索のみですが、拠点や監視先単位での検索等も実装したいです。
8)影響簡易設定
各監視先がダウンした際の影響レベルや、実システムへの影響内容を設定。
この内容はダウン通知メールに記載されて担当者へ届きます。
監視サービスによって使用するエージェントプログラムが変わりますが、基本的に該当プログラムをコピーして置いておくだけでOKです。
サーバプログラムはphpで、設定内容やログはORDBMSへ保存されるので、それらが動作可能な環境であれば簡単に移植出来ます。
社内利用のみを想定していましたが、もう少し機能を充実させて外部提供なども行っていきたいですね。
ご興味がございましたら、お気軽にみつばシステムまでご連絡下さい♪