2007年05月24日

23日の「ひかり電話」の障害は人為ミスとソフトのバグが原因と判明

ひかり電話障害、人為ミスとソフトのバグが原因

 NTT東西地域会社は5月24日、光IP電話サービス「ひかり電話」で前日午前中に起きた障害の原因は、人為的ミスとソフトウェアのバグが重なり、NTT東西間の中継系呼制御サーバ(NTT-MEが管理)が故障したためと発表した。

 障害のきっかけはサーバのHDD交換。中継系呼制御サーバで、21日深夜から22日未明にHDD交換を実施した際、作業員がデータ設定用ソフトに誤ったコマンドパラメータを投入したが、ソフトの誤り対策機能が不十分だったため、コマンドが受け付けられてしまった。(後略)

元記事:ITmedia News


( ´ω`)ノなんと申しますか、NTT東日本と西日本間の「ひかり電話」が通話できない状態という大きな障害が23日に発生した訳なんですが、結局その原因は人為的ミスとソフトウェアのバグという事だそうですよ。
まぁ、こう言う大きなトラブルの原因って往々にして簡単な人為的ミスだったり、ちょっとしたソフトのバグだったりとかするもんですが、今回はまさにその通りと言う感じですかね。

ヾ(・ω・ )この前のNTT東日本の「フレッツ」と「ひかり電話」の通信障害の時も、故障したルータを交換して繋ぎなおした時に、古いソフトウェアのルータがルート計算処理能力を超えちゃって機能停止が連鎖的に広がったんでしたっけのぉ。
今回はNTT東日本のグループ会社のNTT-MEが管理しているNTT東日本と西日本間の中継系呼制御サーバで21日深夜から22日未明にHDD交換を行った際に、作業した人がデータ設定用ソフトに誤ったコマンドパラメータを入れてしまった為だそうですよ。

( ´ω`)ノまた運の悪い事にフェイルセーフ機能が不十分だった為にその誤ったコマンドパラメータが通っちゃった訳なんですねー。
しかも誤ったパラメータでHDDのデータが破壊されてしまうと言うバグがソフトウェアにあった為にHDDのデータが一部破壊されてしまったと。
で、この壊れたデータが23日午前6時25分にサーバのキャッシュメモリに読み出されてしまった為にサーバが停止してしまったと言う事ですね。
処理を代替するサーバとHDDはちゃんと用意されていたそうなんですが、ハードウェア障害の時に切り替わる様に設定されていたとかで、今回の様なソフトウェア障害では機能しなかったと言う事ですよ。

ヾ(・ω・ )コマンドの打ち間違い一つで318万回線が影響受けるんだから怖いですのぉ。
取りあえず対策としてはサーバのフェイルセーフ機能を向上させる事とか、ソフトウェア障害でも代替系に切り替わる様にするとかですかのぉ。
や、そもそも打ち間違いをしない様にしないとですけども、こればっかりは人間のする事ですからのぉ。

( ´ω`)ノでもって、あんまり「ひかり電話」のトラブルが相次ぐもんだから、とうとう総務省からNTT東日本、西日本、NTTMEの3社に対して通信サービスの事故・障害対策の総点検を行う様に行政指導が行われたと言う事でありますよ。
同時に電気通信事業者協会等3つの業界団体にも同じ様な行政指導が行われたそうですよ。
まぁ、やっぱりもうちょっと安定して使える様になって貰わないと困りますからね。

参考ページ
@IT
HDD交換ミス&バグで4時間ダウンしてしまう「ひかり電話」
INTERNET Watch
「ひかり電話」通話障害、原因はハードディスク交換時の設定ミス
ITPro
NTTのひかり電話障害はコマンド間違いが原因、待機系は稼働せず


     


posted by Giselle at 23:59| Comment(0) | TrackBack(0) | ネット・コンピュータ関連 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック
いただいたトラックバックは、spamトラックバック排除の為にすぐには表示されません。管理者による承認後表示されます

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は180日以上新しい記事の投稿がないブログに表示されております。