« 非定型BSEから新規BSEが出現 | トップページ | ELP 展覧会の絵 »

2016.03.23

ANA システム障害

 全日空の大規模なシステム障害のきっかけは「エイブル」と呼ばれる国内線システムのホストコンピューター内で発生した。同社によると、22日午前3時44分、航空券の予約や販売、搭乗をつかさどるサーバー4台のうち1台が突然停止。残る3台から切り離して改修作業を続けたが、8時15分にさらに2台、同22分には最後の1台も停止した。

ANAシステム障害、サーバ4台全てダウン 同期機能に問題? (1/2) - ITmedia ニュース

急にアクセスが増えたのでアクセス解析を見て,このニュースを知りました.

この引用元の記事によると『4台間の同期(情報共有)機能に何らかの問題がある』のが原因らしい.

ANAくらいの規模になると簡単に予備のシステムに切り替えできないのですね.素人の私はサーバーダウンしたら自動的に予備のサーバーが立ち上がってシームレスに運用を継続できるシステムになっているはずと思っていましたが,実際には難しいのでしょうね.

2016/04/01追記:

今回も2007年の時と同じようにスイッチ(Cisco Catalyst 4948E)が原因だったようです.

全日本空輸(ANA)は2016年3月30日、3月22日に発生した国内線システムの不具合について、原因や再発防止策などを公表した。国内線システムの4台のデータベース(DB)サーバーをつなぐ米シスコシステムズ製イーサネットスイッチの故障が原因だった。

ANAシステム障害の原因判明、シスコ製スイッチの「世界初のバグ」でDBサーバーがダウン:日経コンピュータDigital

故障したら自動的に予備に切り替わるようにはなっていたが,それが切り替わらなかった事がシステムダウンにつながったことになります.「故障を検知すると自動で予備に切り替える」と口で言うのは簡単ですが,故障にはいろいろな種類があるため,故障を検知するのはとても難しいことです.多くの種類の故障に対応しようとすると故障検知回路が複雑になり,故障検知回路自身の故障が起きる確率が高くなります.そして故障検知回路の故障がわかるのは,本体の故障が起きた時です.

|

« 非定型BSEから新規BSEが出現 | トップページ | ELP 展覧会の絵 »

「ニュース」カテゴリの記事

「パソコン・インターネット」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/3174/63385727

この記事へのトラックバック一覧です: ANA システム障害:

« 非定型BSEから新規BSEが出現 | トップページ | ELP 展覧会の絵 »