松田軽太のブロぐる

企業の情シスで働いています。会社の中では何をしてるのかナゾな職場の情シスあるあるなどや読んだ本のことなどを思いつくままに書いています。

【スポンサーリンク】

「DXの前に、まずはグッチャグチャになってるデータの整理から始めよう」という話

【スポンサーリンク】

こんにちは! 松田軽太です。

 

このポストがけっこう見ていただけていることに気がつきました。

 

 

ということで、このポストに内容について、ChatGPTとお話しました。

けっこう良いことを言ってくれたのでここに記録しておきますね。

 

1. データ整理の重要性

  • ガベージイン・ガベージアウト(GIGO)の原則があり、入力データが整っていないと、どんな高機能なシステムを導入しても成果は出にくいです。

  • 特にDXの文脈では、AI分析や自動化を進めようとしても、元データが重複・欠損・粒度不一致などの状態では逆に非効率化してしまいます。


2. データ整理ができない理由

  • 整理手法を知らない:正規化、コード体系化、マスタ管理といった基本的なデータモデリングを知らないケース。

  • ツールの使い方が曖昧:Excelやスプレッドシートの段階で、適切な関数やピボット、正規表現を使えない。

  • 属人化:現場ごとに「自分ルール」でデータを持ち、共通化・標準化が進まない。


3. システム導入前にすべきこと

  • データクレンジング:重複・欠損値の除去、フォーマット統一。

  • マスタ整備:顧客・商品・部門などの基準データを統一する。

  • 粒度の統一:日単位なのか、月単位なのか、桁数や単位(kgとgなど)を統一。

  • 運用ルールの明文化:誰がどのタイミングでどんな形式で入力するかをルール化。


4. DXの落とし穴

多くの企業は「ツールを導入すればDXできる」と考えがちですが、実際には データ基盤と運用ルールが整備されて初めてDXが成立 します。
この基盤がないと、せっかく高額なシステムを導入しても「使えない」「データが合わない」といった理由で失敗するケースが多いです。


✅ 結論として、あなたの指摘は正しくて、DXの前提として「データ整理=データ基盤の整備」が最優先事項です。

 

ここから「現場の誰でもできるデータ整理のステップ」を、できるだけシンプルにまとめますね。


✅ 現場で誰でもできるデータ整理ステップ

1. データの現状把握

  • まず「どんなデータがどこにあるのか」を棚卸し。

    • Excelファイル、紙、システム出力などをリスト化。

    • 似たような項目(顧客名、商品名、日付など)がバラバラに存在していないかを確認。


2. フォーマットを統一

  • 日付:「2025/08/31」「2025年8月31日」「8/31」などの混在を「YYYY-MM-DD」に統一。

  • 数値:カンマ区切りや単位を外して「1000」などシンプルに。

  • 文字列:全角・半角を揃える(例:「ABC」と「ABC」)。

👉 これだけで検索・集計が圧倒的に楽になります。


3. 重複・抜けをチェック

  • 顧客リストに同じ人が2回入っていないか?

  • 住所や電話番号が欠けていないか?

  • Excelなら「条件付き書式」や「重複の削除」機能を活用。


4. マスタを作る

  • 頻出する情報は「辞書(マスタ)」を作って参照させる。

    • 例:部署名、商品カテゴリ、都道府県コードなど。

  • マスタを使うことで「営業部」「営業」「営業1課」のようなバラつきを防ぐ。


5. 粒度を合わせる

  • 集計単位をそろえる。

    • 売上を「日単位」で記録するのか、「月単位」にするのか。

    • 金額の小数点以下は切り捨てか四捨五入か。

  • 粒度がバラバラだと分析時に必ず混乱します。


6. 入力ルールを決める

  • 「日付はカレンダーから選ぶ」「商品はプルダウンで選ぶ」など。

  • Excelならデータ入力規則を設定。

  • ルールを守れば、後から整える手間が減る。


7. 定期的に見直す

  • 一度整理しても放置するとまた乱れる。

  • 月次や四半期ごとにチェックする仕組みを作ると長続きする。


🎯 まとめ

  • データ整理は「技術」より「ルール化と習慣化」がカギ。

  • 小さな工夫(フォーマット統一・重複排除・マスタ化)で、システム導入後の効果が劇的に変わる。

  • 最終的に 「誰でも迷わず入力できる状態」 を目指すのが理想。

 

 

 

 

【スポンサーリンク】