障害からの迅速な復旧を実現させるシステム運用について
システムにトラブルが起こった場合、その異常な状態から一刻も早く復旧・回復を行なう必要があります。
多くのケースで、そのために与えられている時間は僅かなものであり、悠長に対応策をあれこれと検討しているような時間は無いものでしょう。
そのため、普段のシステム運用の中でトラブルへの備えが十分に行なわれているかという要素が重要になってくるのです。
トラブルを考慮したシステム運用が回復管理と呼ばれる分野になります。
発生した問題による被害を最小のものに食い止めてることがシステム運用の課題であり、自動的に回復できる部分は可能な限り自動で復旧できる仕組みを検討・導入しておく必要もあります。
もちろん、発生する可能性のあるトラブルのバリエーションを十分に洗い出す必要もあるのです。
それでは、障害からの迅速な復旧を実現させるためのシステム運用について、少しずつ確認していきましょう。