8月8日発生の障害に関するご報告詳細
8月8日に弊社のDCAサーバーにて発生いたしました障害により、お客様へ多大な御迷惑をおかけいたしましたことを、あらためて深くお詫びいたします。
DCAサーバーのハードウェアにて問題が発生し、DCAサーバーをご利用の一部のお客様においてサービスがご利用できないという障害が発生いたしました。ここに、障害の原因につきましてご報告をさせていただきます。また、原因調査にお時間をいただき、ご報告が遅れました事につきましても併せてお詫び申し上げます。弊社といたしましても本件の事態を真摯に受け止め、今後このような事が起こらぬよう、専心努力して参りますので、何卒ご容赦いただけますようお願いいたします。
記
1. 対象サービス
DCAサーバーご利用の一部お客様
2. 発生期間
2006年 8月8日(火)午前6:40 頃 〜 15:00 頃 (日本時間)
3. 状況
データ格納領域のハードウェアで障害が発生いたしました。本来であれば、データ格納領域がダウンした場合には、二重化されたもう片方のハードウェアに自動的にデータの移転が行われ、正常稼動が続くシステムとなっております。しかし、今回はハードウェアに発生した障害の影響により自動的に行われるはずであった切り替え作業が、正常に作動いたしませんでした。
4. 原因
DCAサーバーのご利用ユーザー増加に伴い、データ格納領域を拡張するため、新たに機器をベンダーより納品し、実稼動を行っておりました。その機器のCPU における初期不良が、今回の障害を招いた原因となります。
5. 対応
障害発生後、手作業にて二重化されたもう片方のハードウェアに切り替えを行い、該当のハードウェアを全て交換する事により障害が改善されると判断いたしました。障害原因となっていたハードウェアの交換を実施、パフォーマンスが改善されたことを確認し、復旧に至りました。
6. 今後の対策
今回障害の原因となりました該当のハードウェアに対しましては、ベンダー、弊社共に事前の検証、動作確認を行わせていただきました。しかし、今回の原因となりました箇所であるCPU は、データ量も含め、ある程度の期間、実稼動をさせた後でなければ問題を発見することができないという特殊な箇所でございました。今後は新たなハードウェアの設置、拡張を行う際には、ベンダーとの連携を高め、ハードウェアの検証、動作確認をよりいっそう多角的、細部にわたり行なわせていただきます。また、障害の発生から検知、復旧までの時間を短縮出来るよう、運用の強化を行なっていく所存でございます。
|