データベースのバックアップ戦略とBCP。復旧時間(RTO/RPO)を意識した運用設計
サーバー障害、サイバー攻撃、あるいは人為的なミス。データの消失リスクは常に存在します。企業の重要資産であるデータを守るためのバックアップは、単なる「データのコピー」ではなく、 「業務をいかに迅速に再開させるか」 というBCP(事業継続計画)の視点で設計されるべきです。
復旧の指標: RPOとRTO
バックアップ手法を決定する前に、経営上の許容範囲として以下の2つの指標を定義する必要があります。
- RPO(目標復旧時点):過去のどの時点までデータを戻せれば許容できるか。
- 例:1日1回のバックアップであれば、最大24時間分のデータが失われる可能性があります。受注データや入金履歴など、消失すれば業務に直結するデータは、RPOを短く設定する必要があります。
- RTO(目標復旧時間):障害発生から何時間以内にシステムを再開しなければならないか。
- 例:データ量が膨大な場合、コピーを戻す(リストア)だけで数時間を要することがあります。RTOが短い要件には、スタンバイサーバーや高速リストア手段が必要になります。
RPOとRTOは、コスト(バックアップの頻度・保存容量・冗長設備)と直接トレードオフの関係にあります。「あらゆるケースで最短」を求めるのではなく、業務の重要度に応じてデータ種別ごとに設定することが現実的です。
バックアップの種類と特性
バックアップ方式は、取得方法によって以下の3種類に分類されます。
| 種類 | 内容 | 特性 |
|---|---|---|
| フルバックアップ | データ全体を丸ごとコピー | リストアが単純・高速。容量が大きく、取得時間が長い |
| 差分バックアップ | 前回フルバックアップ以降の変更分のみ | フルより高速・小容量。リストアはフル+差分の2ステップ |
| 増分バックアップ | 前回バックアップ以降の変更分のみ | 最も高速・小容量。リストアはフル+複数増分の多段ステップ |
実用的な運用では、「週1回フル+毎日増分」のような組み合わせが採用されます。RTOを優先するならフルバックアップの頻度を上げ、コストを優先するなら増分バックアップを活用するという判断軸になります。
実効的なバックアップ運用のポイント
「バックアップはとっているが、戻したことがない」という状況は非常に危険です。
- リストアテスト(復旧訓練)の実施:半年に一度はテスト環境で実際にデータを復旧させ、手順に不備がないか、時間内に完了するかを確認します。バックアップが「存在するかどうか」ではなく「正しく戻せるかどうか」が本来の目的です。
- 3-2-1ルールの適用:3つのコピーを持ち、2つの異なるメディア(ディスク、クラウド等)に保存し、1つは遠隔地(別リージョン)に保管します。自然災害や火災に対して単一拠点のバックアップは意味をなしません。
- ログの監視:バックアップ処理が成功したかどうかを毎日監視し、失敗時に即座に通知が飛ぶ体制を整えます。バックアップの失敗は気づかれないまま放置されるケースが多く、障害発生時に初めて気づくという事態を避ける必要があります。
- 保存期間の定義:データの種類(法定保存年限や業務継続性の観点)に応じて、バックアップの保存期間を明示的に設計します。「取り溜めるだけ」では、不要なストレージコストが膨らみ、必要なバックアップが誤って削除されるリスクも生じます。
ランサムウェアとバックアップの設計
近年、バックアップデータそのものを暗号化・破壊するランサムウェアの被害が急増しています。ネットワークに接続された共有フォルダにバックアップを保存している場合、感染によって本番データとバックアップが同時に失われるケースが報告されています。
この脅威に対しては、以下の対策が有効です。
- オフライン保管または書き込み不可の保存先:ランサムウェアはネットワーク接続されたドライブに到達できますが、物理的に切り離されたテープやWORM(Write Once Read Many)ストレージには書き込めません。
- クラウドのバージョニング機能:AWS S3やAzure Blob Storageのバージョニングを有効にすることで、ファイルが上書きされても以前のバージョンに戻せます。
クラウド時代のバックアップ
昨今のクラウドデータベース(AWS RDS、Google Cloud SQL等)では、ポイントインタイムリカバリ(PITR:数分単位での過去復旧)が容易に実装できるようになっています。これにより、「1時間前の状態に戻す」といった細粒度の復旧が可能になります。
しかし、クラウドであっても「誤操作による論理削除」からは逃れられません。物理的なサーバー障害は防げても、DELETE FROM orders WHERE 1=1;(全件削除)のような人為的ミスはクラウドサービスが防ぐことはできません。マネージドサービスの機能を過信せず、論理的なバックアップをどう保持するかの設計は不可欠です。
まとめ:データの価値は「復旧の確実性」に比例する
データベースに蓄積されたデータは、企業の歴史と信頼そのものです。
「バックアップがある」ことに満足せず、「確実に、時間内に、求められる時点の状態に戻せる」体制を整えておくこと。RPO・RTOを経営指標として定義し、バックアップからリストア、そして業務再開まで一貫して設計することが、真の事業継続力を支えます。