Open棟梁Project - マイクロソフト系技術情報 Wiki
「処理能力」の問題や「障害」の発生を未然に防止したり、迅速に対応したりすることで
高い可用性を維持するには、「処理能力」・「信頼性(障害)」に関する情報の監視が必要になる。
一般的に、サーバの監視タスクには、以下の項目がある。
ハードウェアの状態、リソース消費量などの警告を確認して、問題発生の可能性を確認する。
サーバ プロセス独自のリソース(キュー数、スレッド数、仮想アドレス空間など)の利用状況、アクセス状況を確認する。
ハードウェア・ソフトウェアの障害、設定ミスによるエラーの発生情報と発生原因などを確認する。
各種イベント(システム イベント、アプリケーション イベント、セキュリティ イベント)を確認する。
サーバへのリクエスト・レスポンス、レスポンス時間などを確認する。
サーバ上のネットワーク サービスと定期的に通信を行い、正常に動作しているか否かを確認する。
サーバに向かって定期的にpingなどを実行することで、経路が途中で遮断されていないかなどを確認する。
トラフィック監視 ネットワークのトラフィック量、特定のサーバ、サービスへのトラフィック量を定常的に監視することで、トラフィック量が最大になる時間帯の把握や、回線容量の再見積もりができる。 5 アップデートの監視 オンライン アップデートの状況や、その他のソフトウェアの修正プログラム・SPの適用、ハードウェアのドライバの更新状況について確認する。 6 セキュリティ監視 セキュリティ アップデートについて確認する。また、不正アクセス・攻撃、盗聴ノードがないか確認する。