サーバ監視に関する基本中の基本の話 part1

今回から、サーバ監視に関する基本中の基本の話を少しずつしていこうかなと思います。
本記事末尾の"参考"欄に記載した書籍を参考文献とし、サーバ監視の基礎を整理していこうと思います。

注意

サーバ監視に関する基礎を書いて行こうと思いますが、私自身の考えも色々と含まれております。
中には、反論したくなるような考えもあるかもしれませんが、考え方の一つという程度に留めていただければと思います。

監視の目的

今回は、監視の目的について取り上げたいと思います。

監視を行う一番の目的は、利用者が継続してサービスを利用できる状態か確認する事だと思います。
サービスにログインできないなど、サービスが正常に利用できない状態になってしまうと、エンドユーザがサービス利用をやめてしまうなど、利益を得る機会を失うことにつながりかねません。
そのためにも、サーバ監視をしっかり行いサービスの異常にいち早く気づくことが重要になります。

とはいっても、異常が一切発生することのないシステムというのはさすがに存在しません。
どんなに信頼性の高いシステムを構築しても、所詮は作り物。
サーバの劣化・パッケージ製品の不具合・プログラムのバグなどなど、異常のきっかけとなるものは必ず存在します。
バグなどを事前に潰しておくのは前提ですが、それでもどうしても異常は必ず発生します。
なので、異常が発生した場合にいかに早く検知し、早期復旧につなげるかも重要な要素となります。
そして、いち早く検知し、復旧するためにはどこに異常が発生したかをいち早く突き止められるような監視をすることも重要なのではと思います。

まとめ

  • 監視を行う一番の目的は、利用者が継続してサービスを利用できる状態か確認する事にある
  • 異常が発生した場合にいかに早く検知し、早期復旧につなげるかが重要になる
  • ただ監視するだけなく、どこに異常が発生したかをいち早く突き止められるような監視をすることが大切

参考

本記事は、以下を参考にしています。