ITサービスレコーダー

ITサービスレコーダー

 クラウド時代になり、ITインフラ構成は複雑になりました。企業活動のITの利用は業績に大きく影響するようになり、ITサービスが問題なく利用できていることが増々重要になってきました。

 しかしながら、現状では、昨日のITサービスがうまく動作していたのか、していないかのエビデンスがありません。

 また、ITインフラの中に潜在故障がある場合には、一番肝心な時にサービスを利用できないと言うリスクがあります。

 自動車にドライブレコーダーがあるように、ITサービスがうまく利用できているかどうかの記録が必要です。

 ITサービスレコーダーは、ITサービスが問題なく動作していたかどうかの過去の記録を残します。

 本ページでは、「ITサービスレコーダ」ついて詳しく説明します。

 ITサービスレコーダーのパンフレット(pdf)


1.サービスレベル

 電話の通話品質は、MOS値(Mean Opinion Score)が用いられています。MOS値は、評価者が実際に通話を行い、5段階評価を行ったものです。

 サービスレベルを、MOS値に準え次のように定義しています。

 評価値については、複数の評価者の平均値を取ります。

注意点としては、アプリケーションの種類により、遅延が気になる場合とそれほど気にならない場合があります。その場合は、評価値は、アプリケーション毎に行います。

評価値ISR*評価内容対応参考
MOS値
極めて良好使用に問題なし過剰設備かどうかの吟味
・冗長機器の余裕
・回線帯域の調査 等
非常に良い
良 好使用に問題なし 良 い
要監視時々遅くて使い難いトータル監視の考え方に基づく分析
シビアな監視、トラップによる解析
普 通
対応要毎日or週に1度は、
遅くて支障が出ている
至急の対応が必要悪 い
故 障利用できない即時対応、サービス回復非常に悪い

注)ISR:IT Service Recorder

 通常の保守監視サービスは、評価1の対応しか行っていないケースが多く、故障にならないと評価2の対応が必要なことも分かりません。

 評価2の段階とは、エンドユーザが何かおかしいと感じても、どうにか使えるので我慢しているが、ある時、我慢できなくなり爆発すると言うようなケースです。

2.EEC(End to End Checker)について

 ITサービスレコーダーにおける、EECの役割を以下に示します。

ITサービスレコーダーの概念

 使えば使うほど品質が向上するためのノウハウを用いるために、お客さまのITサービスに関する試験データを収集するのが、EECになります。EECで収集したデータを元にアクションを継続していくことが運用サービスでは重要です。


 以下、EECについて説明します。


(1)アーキテクチャ
  CentOS(Linux)上に、WEBサーバのApache、及び独自作成プログラムで構成されます。


(2)システム構成例
 通常はEECをセンタに1台設置します。お客さま環境により拠点に1台設置する場合もあります。


ITサービスレコーダーのシステム構成例


 センタに設置するEECは、ネットワークレイヤの試験を行うため、各拠点のルータ、ルータ配下の機器にping試験を行います。

 拠点に設置するEECは、アプリケーションサーバへのポート試験、Wget試験を行います。必要な場合には、作り込みでよりアプリケーションに近いレベルの試験を行います。

3.遅延に関するお客さまの不満の限界値

 次にEECの表示例を示します。

 ネットワークに接続されたどのPCからも、WEBブラウザを利用してEECの情報を表示できます。


表示例1:ある日のデータで、拠点EECから、WEBサーバにWGET試験を行った例を示します。
EECの表示例1
 凡例 青:速い、緑:少し遅い、紫:遅い、赤:timeout


 表示の見方は、例えば、1時間に100回試験をして、100回とも速ければ、全て青色になります。
 仮に、50回が速く、50回が少し遅い場合は、半分が青色、半分が緑色となります。すなわち、速い、遅い、少し遅いのパーセント表示を行っています。


 青、緑、紫の閾値は自由に変更できます。例えば、この日の13時台は、「使用に支障が出た」とエンドユーザから申告があれば、閾値を変えて13時台が、他の時間と違いが出るように閾値を変更します。


表示例2:上記と同じ日で、閾値をシビアにした場合の例を示します。
EECの表示例2

上記の例の13時台のような色分布の場合を、

エンドユーザがアプリケーションを使う場合の耐え難い遅延値として、

その閾値を「不満の限界値」とします。

 この限界値を元に、同じような現象が生じるかどうかによって、ITサービスが問題なく利用できたか、利用できないかを判断します。


次のグラフは限界値を示したイメージ図です。


お客さま不満の限界値


 表示例2の13時のような場合には、限界値を超えたことになります。

 このように、限界値を定義できましたので、その限界値を超えていなければ、ITサービスが問題なく利用できていたことが証明できます。


4.全機器をシンプルなワンインタフェースで表示

 ネットワーク機器、サーバ、クラウド機器の全ての機器をシンプルなワンインタフェースで表示します。

該当機器、サーバについてのレスポンスタイムを時間軸ごとに棒グラフのパーセントで分かり易く表示します。
 普通  :青色
 少し遅い:緑色
 遅い  :紫色
 timeout:赤色
と、単一インタフェースで、全てのITサービス機器を表します。

画像の説明

 




 画面出力イメージ




次に示すのは、ITサービスレコーダを設置した構成例です。

画像の説明

<サーバ群 (オンプレミス、クラウドとも同一インターフェース)>
①社内システム
②クラウド利用:Webメール
③クラウド利用:営業支援システム

<NW機器、FW等>
④拠点ルータ_A
⑤拠点ルータ_B
⑥FW

の機器を同じパターンで分かり易く表示します。

ITサービスレコーダーの統一した表示例

図をクリックすると拡大します。


5.導入のメリット

情報システム部門の方に取って次の4つのメリットがあります。
(1) 常時監視
 利用者からみた、ITインフラのサービス提供をリアルタイムで監視することができます。
 通常の監視装置としても利用できます。

ITDR アラームナウ


(2) エンドユーザからの問合せに明確に回答できます。
次の例では、「17時台に不具合だった」のが分ります。
これまでは、「調べて見ます。」の回答でしたが、
これからは、不具合を事前に発見できますので、
不具合を発見しておりますので、現在対応中です。暫くお待ちください。
の回答が可能となります。

不具合のケース


(3) 予防保全、機器の不具合の兆候の発見
 統計情報(月毎故障のまとめ)により、
 ITインフラの予防保全、機器の不具合の兆候を発見できます。

統計情報(月毎故障のまとめ)


 閾値を厳しくすることにより、常に、品質レベルの悪い機器、ノードを抽出することができ、品質改善に繋がります。使えば使うほど品質が向上して行きます。


(4) ベンダ(クラウド利用を含む)、キャリアへの明確な指示ができます。
 全ての機器、常時の監視記録があるため、ベンダ、キャリアにトラブルの状況を明確に伝えることができます。
 エビデンスなしのベンダへ問合せでは、確りした調査を行って貰えないケースが多いですが、エビデンスを付けて、問合せを行うことにより、問題解決が早まります。


このITサービスレコーダを導入することにより、保守要員1名相当分の導入効果があります。


6.アクションレポートNEW

 弊社では、定期的に(通常1月に1回)アクションレポートを提出します。
 お客さまのITサービスの利用の現状、トラブル状況、取るべきアクションを端的に提示します。

次に示しますのは、あるお客さまへのアクションレポートの抜粋です。

 アクションレポートの例(抜粋)(pdf)

(1)課題のあるノードは、別グループにより特別監視を行います。
(2)問題がないグループでは、遅延にフォーカスして、レスポンス値の閾値をシビアにし、月に数回程度はアラーム記録が残るように設定します。
(3)潜在故障等原因が分かり難い場合は、カスタマイズ試験を行い各種トラップを設定し、原因究明を試みます。


7.自社でのNMW運用とITSRを利用した場合の比較NEW

 各種NMS(ネットワークマネージメントシステム)がありますが、
自社で運用されている場合、次のような問題点はありませんか。

(1)NMSの豊富な機能を使いこなせない。
(2)機能を覚えるのに時間がかかる。
(3)毎日故障が起きるわけではないので、ツールを理解するための時間が無駄。
(4)導入したものの、殆ど触っていない。
(5)性能監視(CPU能率、プロセス監視等)を行っているが、少し複雑な実際のトラブルでは、有効に機能していない。
(6)日々の業務に追われ、ある時大きなトラブルが発生し、慌てて改善の繰り返し。

 自社でNMSを利用された場合とITサービスレコーダーを利用した場合の比較を次に示します。

自社でNMSを利用された場合とITサービスレコーダーを利用した場合の比較

表をクリックすると拡大します。

表に示したとおり、ITサービスレコーダーをご利用頂ければ、どんなアクションが必要なのかを示すアクションレポートにより、利用すれば利用するほど、品質が良くなる仕組みを取っております。

日々お忙しい情報システム部門の方が、本来の戦略業務に注力できるようにITサービスの状況を記録する、ITサービスレコーダーの導入を是非ご検討下さい。



8.まとめ

 ここで説明したITサービスレコーダーを導入することにより、
〇過去のITサービスの利用に問題があったのか、なかったかをエビデンスを持って証明できます。

〇これまでの、保守サービスは、評価値1レベルにあったものを、評価値4まで引き上げる仕組みが提供できます。

 すなわち、
  ・潜在故障の事前発見
  ・限界値に近づいているかどうかの把握
  ・サービスが利用できない時間の短縮
 が可能になります。

これを実現するために、弊社では、トータル監視の仕組みを取りえれております。トータル監視のページもご参照下さい。

  トータル監視のページへ

 今後は、保守レベルを上げる方法として、ITサービスレコーダーの導入が有効と考えられます。

  保守サービス特徴のページへ

  ネットワークの遅延のページへ

  アプリケーションの遅延ページへ

  お問合せのページへ

a:1761 t:7 y:4

最新の更新 RSS  Valid XHTML 1.0 Transitional