メール送受信障害について

2005年10月28日

お客様各位

日本インターネットアクセス(株)
代表取締役 春日裕忠

2005年10月25日に発生しましたメール機能の障害に関するご報告

 拝啓 時下益々ご盛祥の事とお慶び申し上げます。

 平素はインフォニア/インターネットマートをご利用いただきまして誠にありがとうございます。

 2005年10月25日に発生いたしましたメール送受信機能の障害ではお客様に大変ご迷惑をおかけいたしました。謹んでお詫び申し上げます。今回の障害原因は昨年発生しましたファイルサーバーのハードウエアトラブルで、短期間に二度も同じ原因によるものであったことを重大視し、今回の障害経緯と、今後の対応策について、下記のとおりご報告させていただきます。
 今後とも何卒よろしくお願い申し上げます。

敬具

 ●障害発生から復旧までの経緯
月日 時分 障害関係
10月25日 14時55分 ファイルサーバーの異常を示すアラーム発生
  14時56分 現状確認・障害対策開始
  15時15分 弊社技術員による現状確認
  15時38分

データセンター待機技術員による機器状態確認、専門保守業者へ通知

  16時13分 故障個所同定
  16時17分 機器再起動
  16時38分 機器再起動
  16時59分 機器再起動
  17時14分 故障部品形状、結線、設置再確認
  17時40分 機器再起動
  18時5分 弊社技術員による機器再起動
 

20時5分

専門保守業者による現状確認、応急処置開始
  20時18分 再起動
  20時29分 サービス復帰
  22時30分 再度機器停止
  22時45分 機器再起動
  22時56分 機器再起動・再調査、専門保守業者手配
10月26日 0時40分 弊社技術員、専門保守業者による現状確認
  1時12分 機器再起動
  1時30分 メーカー代替機器手配、修理部品手配
  1時55分 弊社代替機器構成開始
  8時55分 弊社代替機器準備完了
  11時10分 弊社代替機器での復帰方針に決定
  14時16分 応急的に復旧完了
  14時50分 全データバックアップ開始(障害機器切り離し作業開始)
  18時30分 弊社代替機器追加
  21時0分 遅延ほぼ解消を確認
  4時30分 弊社代替機器にデータ投入開始(緊急メンテナンス)
10月27日 8時45分 データ投入完了
  12時5分 弊社代替機器データ再配置開始(緊急メンテナンス)
  13時43分 弊社代替機器データ再配置完了
  13時48分 弊社代替機器で運用開始(障害機器切り離し完了)


●障害機器について
 障害機器ファイルサーバー(NAS)で、ファイバーチャネルとよばれるコントローラとディスクを接続するインターフェースに故障の原因がありました。昨年の障害でも同機器の中枢部(マザーボード)の故障でした。機器はメジャーなものですが、構造が複雑で汎用的な部品で構成されているものではないので、代替機による障害復旧までに時間を要しておりました。
本機器の故障により、今回はPOP/IMAPサーバに多くの障害をもたらしてしまいましたが、ネームサーバ、認証サーバー、SMTPサーバーに関しても一時的に障害が発生しました。そのため、遅延時間の増大を招いた可能性があります。

●今後の対策について
 昨年度の障害と同一機器が原因であったことを重く受け止め、サービスの中心で機能していた当該機器を切り離し、弊社サービスの特性、お客様のニーズ、障害頻度の低下、障害発生時間の短縮を優先とした機器構成に変更することにいたしました。現在もその新形態で暫定的ではありますが、安全に運用を再開しております。
しかし完全な本格運用のためには、本年中に数回メンテナンスを実施し、12月中旬には安定運用に移行いたします。メンテナンスの際にはサービス停止を伴うため、再びお客様にご迷惑をおかけすることになりますが、何卒ご理解ご協力をいただきますようお願いいたします。
 また、障害発生時の状況報告などについて、お客様からいくつかご要望をいただいており、その中でも状況報告頻度(更新頻度)のアップ、徹底は改善すべき点として反省しております。早急に対応をさせていただきます。

今回は長時間にわたりご迷惑をおかけして本当に申し訳ございませんでした。


ご不明な点などがございましたら support@infonia.ne.jp までお問い合わせください。