日本の夏に発生する落雷、台風、風雨、地震といった自然災害発生時だけでなく、いつ起きてもおかしくない停電、皆さんはそんな停電でサーバーなどにトラブルが起きてしまった経験がある方もいらっしゃるのではないでしょうか?
万が一、停電でサーバーに障害が発生したとき、あわてないために事前に準備しておくことが重要です。ハードウェアのトラブルだった場合は機材が必要になりますが、データを守るためには、テープなど(電気がつながっていない媒体)へのバックアップが有効です。外部メディアに毎日バックアップをとっておくことを検討しましょう。
バックアップだけではなく、急なサーバーの停止が業務に大きな影響を与える可能性がある場合には、緊急時にすぐに使える予備のサーバー(ハードウェア)を用意しておくことも考えられます。いざという時のために自社に最適な停電時の備えを検討し、準備しておきます。
ここでは、停電でサーバーにトラブルが起きないための備えと、万が一、サーバーにトラブルが起きた場合、あわてないよう対処法、データ消失を防ぐためそして計画停電に備える対策を紹介していきます。
1.停電後に発生しやすい5のトラブルと対処法
停電後には、サーバーにトラブルが発生している可能性が非常に高いものです。よくあるトラブルとしては以下の5つがあります。
a . 通電しない
b. サーバーから異音がする
c. サーバー画面にエラーが表示される
d. PCからアクセスができない
e. ランプ点滅し、警告音が出る
サーバーは、ハードディスク、CPU、メモリ、ネットワーク、電源等あらゆる部品が電気的につながり構成され、WindowsやLinuxといったさまざまなOSが構成されているため、障害内容によって起きる症状は様々です。ここからそれぞれのトラブル対策を確認していきます。
1-1. 5つのトラブル発生時の対応策
a. 通電しない
停電によって自動的に電源のスイッチが切れている場合などがあります。まずは、落ち着いて電源の確認をしましょう。
通電しない場合、すぐにサーバーの再起動を試すのではなく、まずは電源ケーブルとコンセント差し込み口などに問題がないか確認をします。停電によって、高圧な電流が流れケーブルが通電しなくなったり、コンセントの差し込み口自体が壊れている可能性もありますので、まず状況確認が必要です。また、ケーブルやコンセント差し込み口に問題がない場合、ブレーカーが部分的に落ちていないかの確認を行います。もし、ブレーカーを上げなおす必要がある場合は、先に電源ケーブルをサーバーから抜き、ブレーカーを上げ、次に機器の電源を入れるようにします。
万が一、コンセント差し込み口などに被害が出ている場合、漏電の可能性もありますので、「何が原因でコンセントが使えないのか」早急に調査が必要と考えられ、電気/配線工事業者に連絡が必要です。
b. サーバーから異音がする
停電後の異音発生の場合、ハードウェアに物理的な障害が発生しているケースが考えられます。このケースでは、データを復旧するのは非常に難しいと考えらえますので、メーカー修理が必要になることが多いです。そのため、サーバーの購入元への相談をお勧めします。
c. サーバー画面にエラーが表示される
停電によって記憶媒体関連のエラーが一時的に出ている場合、電源の入り切り(ON/OFF)を行うことで改善するケースがあります。ただし、電源の入り切りはサーバーへの負担が大きく二次的被害が発生し他の障害の併発になりかねないため、電源の入り切りを試す際は1回のみ行います。電源のON/OFFを繰り返すと、軽度の障害がより悪化する可能性がありますので、控えましょう。また、表示されるエラーメッセージが必ずしも正確ではない場合も多々ありますので注意が必要です。
機器本体やハードディスク自体は故障していない論理障害の場合、システムやデータ破損の問題が考えられるため、バックアップデータからの復旧を検討します。
d. PC(外部)からアクセスができない
サーバーが正常に稼働しているのに、外部からサーバーにアクセスできない場合、ネットワーク接続に問題があると考えられます。停電から復旧後、ルーターの接続が不安定になるということもあるため、インターネットにつながらないという時は、ルーターなどの機器の再起動で改善することがあります。
サーバー自体に論理障害が発生していることも考えられるため、サーバーの電源の入り切りを試す場合は、1回のみ行います。b.と同様に、論理障害/物理障害の場合の対応策を行います。
e. ランプ点滅し、警告音が出る
点灯しているランプの色や警告音の種類などを確認し、それらの情報からマニュアルと照らし合わせ、復旧および対応策を実施します。復旧を行ってもランプの点滅や警告音が消えない場合は、ハードウェア障害が発生しているケースが考えられますので、サーバーの購入元への相談をお勧めします。
2.停電後、サーバーに不具合が発生しないようにするための3つの備え
停電後にサーバーに不具合が出ていることに気がついたら何をすべきかを事前に決めておくと、いざというとき役立ちます。停電時に慌てないための備えを3つご案内します。
ただし、長年利用していたサーバーが停電による影響で突然故障する可能性があります。ハードウェアなど物理的な障害による問題の場合は、専門業者やサーバーの購入元に相談が必要となります。
2-1. 運用手順をマニュアル化し確立しておく
停電時にシステムがダウンした場合、立ち上げ方法の運用手順をマニュアル化しておくことが重要です。たとえば、サーバーを起動する前にルーターなどネットワーク関連機器を先に起動が必要です。シャットダウンする順を守らないと正常起動できない場合がありますので注意が必要です。また、同様にすべて同時に起動ではないため手順をまとめ、マニュアル化しておきます。
サーバーに不具合があると、再起動を何度もしてしまう方もいらっしゃいますが、むやみに再起動を繰り返してしまうとサーバーの負担が高くなり、別の障害が発生してしまうことがありますので、再起動を繰り返したりはしないようにします。
2-2. 保守業者や社内の連絡先を一覧表にまとめておく
サーバーに不具合(起動できない)があった場合のシステム、ソフトウェア、機器の社外の保守業者、社内の担当者の連絡先を一覧表にまとめておきます。
2-3. 復旧用のバックアップデータを準備しておく
OSやアプリケーションエラーの場合、バックアップデータから復旧ができますので、バックアップは日常的に行っておきます。
注意:バックアップからの復旧が有効なのは、論理障害※の場合になりますが、やみくもに復旧しても壊れる可能性は否めません。きちんとメーカーに相談して、バックアップからのデータの復旧が有効なのかを事前に確認することをお勧めします。
物理的(ハードウェア)な故障の場合は、無理に復旧を試みず、専門業者に相談します。
※論理障害とは、機器や部品が物理的に破損していないデータ障害で、ファイルシステムの破損、フォルダやファイルの削除などで、OS(オペレーションシステム)が起動できないといったエラーや論理的故障が発生するデータ障害のことを指します。論理障害の場合、サーバーとは異なる別のハードディスクなどにバックアップしていれば、論理障害の発生したサーバーのディスクフォーマットやOS(オペレーションシステム)の再インストールをすることで、サーバーの復旧ができます。
[お勧めのバックアップはイメージバックアップ]
Arcserve UDP (イメージバックアップ)では、OS、システム、アプリケーション、データを含めてサーバー丸ごとバックアップ/復旧(フォルダ/ファイル単位の復旧も可能)ができ、簡単運用ができます。
Arcserve UDP のバックアップで停電時のサーバー障害に備えましょう。
・Arcserve UDP の詳細は、「Arcserve UDPのご紹介」を参照ください。
・Arcserve UDP の無償トライアル版は、こちらからお申込みいただけます。
Arcserve UDP の無償トライアルは、30日間すべての機能をお試しいただけます。
3.計画停電の準備と実行
計画停電の準備は、大きく3つの対策に分けられます。
・停電前に行うべき事前対策
・停電前日(まで)に行う対策
・停電後に行うべき対策
ここで紹介する計画停電の準備は、突発的な停電時のも役立ちますので、事前準備を怠らないようにしましょう。
3-1. 停電前に行うべき事前対策
✓ マニュアル化
正常にシャットダウンを行うため、システム、アプリケーションなどをリスト化し、ドキュメントとして整備、またシャットダウン、立ち上げ方法をマニュアル化しておくようにします。
UPSを利用している場合は、サーバーシャットダウン後にUPSをシャットダウンします。
電源を落とす順は、クライアントPC→サーバー→UPSの順になります。
✓ 保守業者、社内の担当者の連絡先一覧表の作成
万が一に備え、システム、ソフトウェア、機器の社外の保守業者、社内の担当者の連絡先一覧表を準備します。
✓ サーバーおよびサービスの洗い出し
24時間365日体制で稼働が必要な業務が何か洗い出し、停電に対する影響と回避策を検討しておく必要があります。
24時間365体制で稼働が必要なシステムの場合、発電機の利用や支店やクラウドなど別拠点での運用を検討します。
✓ 停電中のオフィス立ち入りの確認
停電中のオフィスへの立ち入りについて確認します。停電中は、ビルへの入館などに必要な電子システムや監視カメラも停止してしまうため、オフィスへの立ち入りの管理について事前に確認します。停電時に、ビルへの入館などが行われた場合、記録を残す必要がありますので、停電について社内へ連絡を行い、必要最低限のオフィス立ち入りにする必要があります。
✓ バックアップを準備し、復旧テストの実施
万が一に備え、バックアップを導入し、バックアップから問題なく復旧できるかを事前にテストします。
計画停電であっても、サーバーの電源のON/OFFによって負荷がかかり、経年劣化したハードウェアの場合、その負荷に耐え切れず故障が発生してしまうケースがあります。また、OSやソフトウェアも、再起動の影響で正常に起動しない場合があります。ハードウェア障害の場合はメーカー依頼になりますが、OSやソフトウェアの場合はバックアップから復旧が可能ですので、事前に復旧用のバックアップを準備します。
3-2. 停電前日までに行う対策
✓ バックアップの実行
停電前日までにバックアップを行います。できる限り、直近のバックアップデータを残すために、ファイルサーバーなどユーザーが日常的に利用しているサーバーは計画停電の前日にバックアップする必要があります。いざ停電時にバックアップが間に合わない、といったことが起こらないよう、バックアップ時間の確認を事前に行って、計画的にバックアップします。
※Arcserveでは、計画停電のためのバックアップ手順書を準備しておりますので、ご参考に一読ください。(最新バージョンのご案内ではありませんが同じ手順が利用できます。)
- Arcserve UDP v6.5 Consoleでの計画停電時の注意事項と作業方法
- Arcserve UDP v6.5 Agentでの計画停電時の注意事項と作業方法
- Arcserve UDP v6.5 Linux Agent計画停電時の注意事項と作業方法
参考:Arcserve カタログセンター
Arcserve カタログセンターには、ステップバイステップで画面入りの 環境構築ガイドなど
多数資料を掲載していますのでぜひ一度覗いてみてください。
✓ シャットダウンの実行
システムやソフトウェア、機器の正常シャットダウンの事前テストと前日にシャットダウンを行います。
✓ 電源からの切り離し
シャットダウン後、すべてのサーバーおよび機器のACアダプタを電源から切り離します。
3-3. 停電後に行うこと
✓電源につなぐ
すべてのサーバーおよび機器のACアダプタを電源につなぎます。
✓ 起動
システム、ソフトウェア、機器を手順書に沿って正しい順で正常に立ち上げます。UPSを導入している場合、サーバーよりも先にUPSを起動します。
✓ 接続テスト
すべての危機が起動したら、サーバー、およびアプリケーションなどの接続テストを行います。問題がないことが確認できたら、ユーザー(利用者)へ通知します。
まとめ
停電時のサーバーのトラブルについては、未然に防ぐことができない何が起こるかわからないとても厄介な問題です。被災時の突然の停電や計画停電時にも備えとして準備しておけば、あわてずに停電後のトラブルにも対応できます。
ハードウェア故障に関しては部品交換するしか解決方法はないと考えられますので、保守業者、社内の担当者の連絡先一覧表を準備しましょう。OSやソフトウェアに関しては復旧できる場合がありますので、日常的にバックアップを用意しておきましょう。
また、計画停電はいつ実施されるかわかりませんので、以下の3つの対策を行っておくことが重要です。
・停電前に行うべき事前対策
・停電前日(まで)に行う対策
・停電後に行うべき対策
最後までお読みいただきありがとうございました。
地震で得た教訓がとても生かされている記事がありましたので、ご参考までにお知らせします。
災害時のデータセンター運用に必要なこと–さくらインターネットが北海道地震で得た教訓とは|zdnet
コメント