Open棟梁Project - マイクロソフト系技術情報 Wiki

目次

概要

「処理能力」の問題や「障害」の発生を未然に防止したり、迅速に対応したりすることで
高い可用性を維持するには、「処理能力」・「信頼性(障害)」に関する情報の監視が必要になる。

一般的に、サーバの監視タスクには、以下の項目がある。

処理能力の監視

サーバ マシン

ハードウェアの状態、リソース消費量などの警告を確認して、問題発生の可能性を確認する。

サーバ プロセス

サーバ プロセス独自のリソース(キュー数、スレッド数、仮想アドレス空間など)の利用状況、アクセス状況を確認する。

ログ監視

信頼性(障害)

ハードウェア・ソフトウェアの障害、設定ミスによるエラーの発生情報と発生原因などを確認する。

イベント

各種イベント(システム イベント、アプリケーション イベント、セキュリティ イベント)を確認する。

アクセス

サーバへのリクエスト・レスポンス、レスポンス時間などを確認する。

死活(生存)監視

サービス

サーバ上のネットワーク サービスと定期的に通信を行い、正常に動作しているか否かを確認する。

ネットワーク

サーバに向かって定期的にpingなどを実行することで、経路が途中で遮断されていないかなどを確認する。

ネットワークの

トラフィック監視 ネットワークのトラフィック量、特定のサーバ、サービスへのトラフィック量を定常的に監視することで、トラフィック量が最大になる時間帯の把握や、回線容量の再見積もりができる。 5 アップデートの監視 オンライン アップデートの状況や、その他のソフトウェアの修正プログラム・SPの適用、ハードウェアのドライバの更新状況について確認する。 6 セキュリティ監視 セキュリティ アップデートについて確認する。また、不正アクセス・攻撃、盗聴ノードがないか確認する。


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS