データ移行の「人件費」を見落とすな:1万件のデータ整備に要する工数と外注単価

新しいシステムを導入する際、意外と見落とされがちなのが「データ移行」のコストです。ベンダーの見積もりに「データ移行支援」という項目があっても、それはあくまで「データの流し込み」の費用であり、その前の「データの整理(クレンジング)」は発注者の責任とされることがほとんどです。

1万件のデータを「手作業」で直すといくらかかるか?

例えば、10年前から使っている顧客名簿1万件を、新しいCRM(顧客管理システム)に移行する場合を考えてみましょう。

  • 住所の表記ゆれ(1丁目2番 vs 1-2)の統一
  • 電話番号のハイフンの有無
  • 重複した顧客データの統合(名寄せ)
  • 担当者名が抜けているデータの補完

これらを1件あたり平均3分でチェックし、修正するとします。 10,000件 × 3分 = 30,000分 = 500時間

社員が通常業務の合間に行うのは不可能です。派遣社員や外注を雇うと、時給2,000円としても 100万円のコスト が、開発費とは別にかかる計算になります。

データクレンジングが長期化する3つの理由

実際のプロジェクトでは、当初の見積もりよりもクレンジング工数が大幅に膨らむケースが頻発します。その主な原因は以下の3点です。

  1. 問題の発見が現物を見るまでわからない: どのデータが汚れているかは、実際にデータを目視するまで把握できません。「大体こんなものだろう」という事前見積もりは、ほぼ例外なく甘くなります。
  2. 業務ルールの再発見: データを整理していると、「このコードはどういう意味だったのか」「この空白は意図的な空白なのか」といった業務上の不明点が続出します。これらの確認に現場との往復コミュニケーションが発生します。
  3. 連鎖的な問題: 顧客データを直したら、紐づく注文データにも影響が生じる、というように、一箇所の修正が別のデータの問題を露出させることがあります。

データ移行を「コストダウン」するための戦略

データ移行のコストを抑えるには、以下の3つの判断が必要です。

  1. 「全部」移行しない: 過去10年のデータを全て持っていく必要はありますか?「直近2年分だけ」と割り切るだけで、工数は激減します。
  2. 「汚いデータ」は捨てると決める: 不完全なデータは無理に直さず、新システムで取引が発生した都度、最新情報を入れ直す運用にする。
  3. 初期投資として「名寄せツール」を使う: 手作業で100万円かけるなら、50万円で名寄せツールを導入したり、AIによる自動変換を活用した方が安く、精度も高まります。

移行後の「データ品質チェック」を計画に組み込む

データを新システムに流し込んだ後にも、検証のコストが発生します。

  • 件数の照合: 旧システムの件数と新システムの件数が一致しているか。
  • サンプルの目視確認: 抽出したサンプルデータが正しく移行されているか。
  • 業務ロジックのテスト: 移行したデータを使って、集計・帳票出力などが正常に動くか。

このフェーズを省略すると、「移行完了」として本番稼働した後に「データがおかしい」という事態が発覚し、全件の見直しという最悪のシナリオになります。データ品質チェックにかかる工数も、移行コストの一部として予算計上してください。

「ゴミを入れたら、ゴミが出てくる」

IT業界には「GIGO(Garbage In, Garbage Out)」という言葉があります。どんなに高価なシステムでも、中身のデータがバラバラであれば、正しい分析も効率的な業務も不可能です。

データ移行の工数を「現場が頑張ればなんとかなる」と楽観視せず、立派なIT投資の一部として、予算と時間を確保してください。この準備を怠ると、新システムは稼働初日から「使いにくいゴミの山」になってしまいます。